Краткое введение в двумерный анализ
Термин двумерный анализ относится к анализу двух переменных. Вы можете это запомнить, потому что приставка «би» означает «два».
Цель двумерного анализа — понять взаимосвязь между двумя переменными. Вы можете сравнить этот тип анализа со следующим:
- Одномерный анализ : анализ одной переменной.
- Многомерный анализ: анализ двух или более переменных.
Существует три распространенных способа выполнения двумерного анализа:
1. Диаграммы рассеяния.
2. Коэффициенты корреляции.
3. Простая линейная регрессия.
В этом руководстве представлен пример каждого из этих типов двумерного анализа с использованием следующего набора данных, который содержит информацию о двух переменных: (1) часах, потраченных на обучение, и (2) баллах на экзаменах, полученных 20 разными студентами:
1. Облака точек
Диаграмма рассеяния обеспечивает визуальный способ выполнения двумерного анализа. Это позволяет нам визуализировать взаимосвязь между двумя переменными, помещая значение одной переменной на ось X, а значение другой переменной на ось Y.
На приведенной ниже диаграмме рассеяния мы откладываем количество учебных часов по оси X, а результаты экзаменов — по оси Y:
Мы ясно видим, что между этими двумя переменными существует положительная связь: по мере увеличения количества учебных часов результаты экзаменов также имеют тенденцию к увеличению.
2. Коэффициенты корреляции
Коэффициент корреляции обеспечивает еще один способ выполнения двумерного анализа. Наиболее распространенным типом коэффициента корреляции является коэффициент корреляции Пирсона , который является мерой линейной связи между двумя переменными. Он имеет значение от -1 до 1, где:
- -1 указывает на совершенно отрицательную линейную корреляцию между двумя переменными.
- 0 указывает на отсутствие линейной корреляции между двумя переменными.
- 1 указывает на совершенно положительную линейную корреляцию между двумя переменными.
Эта простая метрика дает нам хорошее представление о том, как связаны две переменные. На практике мы часто используем диаграммы рассеяния и коэффициенты корреляции, чтобы понять взаимосвязь между двумя переменными, чтобы мы могли визуализировать и количественно оценить их взаимосвязь.
3. Простая линейная регрессия
Третий способ выполнения двумерного анализа — использовать простую линейную регрессию .
Используя этот метод, мы выбираем одну переменную в качестве объясняющей переменной , а другую переменную в качестве переменной ответа . Затем мы находим строку, которая лучше всего «соответствует» набору данных, которую затем можем использовать, чтобы понять точную связь между двумя переменными.
Например, наиболее подходящая строка для приведенного выше набора данных:
Оценка за экзамен = 69,07 + 3,85*(учебные часы)
Это означает, что каждый дополнительный час обучения связан с повышением среднего балла на экзамене на 3,85. Подбирая эту модель линейной регрессии, мы можем количественно оценить точную взаимосвязь между учебными часами и оценкой на экзамене.
Связанный: Как выполнить простую линейную регрессию в Excel
Заключение
Двумерный анализ — один из наиболее часто используемых типов анализа в статистике, поскольку мы часто хотим понять взаимосвязь между двумя переменными.
Используя диаграммы рассеяния, коэффициенты корреляции и простую линейную регрессию, мы можем визуализировать и количественно оценить взаимосвязь между двумя переменными.
Часто эти три метода используются вместе в анализе, чтобы получить полную картину взаимосвязи между двумя переменными. Поэтому рекомендуется ознакомиться с каждым методом.