Краткое введение в двумерный анализ


Термин двумерный анализ относится к анализу двух переменных. Вы можете это запомнить, потому что приставка «би» означает «два».

Цель двумерного анализа — понять взаимосвязь между двумя переменными. Вы можете сравнить этот тип анализа со следующим:

  • Одномерный анализ : анализ одной переменной.
  • Многомерный анализ: анализ двух или более переменных.

Существует три распространенных способа выполнения двумерного анализа:

1. Диаграммы рассеяния.

2. Коэффициенты корреляции.

3. Простая линейная регрессия.

В этом руководстве представлен пример каждого из этих типов двумерного анализа с использованием следующего набора данных, который содержит информацию о двух переменных: (1) часах, потраченных на обучение, и (2) баллах на экзаменах, полученных 20 разными студентами:

1. Облака точек

Диаграмма рассеяния обеспечивает визуальный способ выполнения двумерного анализа. Это позволяет нам визуализировать взаимосвязь между двумя переменными, помещая значение одной переменной на ось X, а значение другой переменной на ось Y.

На приведенной ниже диаграмме рассеяния мы откладываем количество учебных часов по оси X, а результаты экзаменов — по оси Y:

Двумерный анализ с диаграммой рассеяния

Мы ясно видим, что между этими двумя переменными существует положительная связь: по мере увеличения количества учебных часов результаты экзаменов также имеют тенденцию к увеличению.

2. Коэффициенты корреляции

Коэффициент корреляции обеспечивает еще один способ выполнения двумерного анализа. Наиболее распространенным типом коэффициента корреляции является коэффициент корреляции Пирсона , который является мерой линейной связи между двумя переменными.   Он имеет значение от -1 до 1, где:

  • -1 указывает на совершенно отрицательную линейную корреляцию между двумя переменными.
  • 0 указывает на отсутствие линейной корреляции между двумя переменными.
  • 1 указывает на совершенно положительную линейную корреляцию между двумя переменными.

Эта простая метрика дает нам хорошее представление о том, как связаны две переменные. На практике мы часто используем диаграммы рассеяния и коэффициенты корреляции, чтобы понять взаимосвязь между двумя переменными, чтобы мы могли визуализировать и количественно оценить их взаимосвязь.

3. Простая линейная регрессия

Третий способ выполнения двумерного анализа — использовать простую линейную регрессию .

Используя этот метод, мы выбираем одну переменную в качестве объясняющей переменной , а другую переменную в качестве переменной ответа . Затем мы находим строку, которая лучше всего «соответствует» набору данных, которую затем можем использовать, чтобы понять точную связь между двумя переменными.

Например, наиболее подходящая строка для приведенного выше набора данных:

Оценка за экзамен = 69,07 + 3,85*(учебные часы)

Это означает, что каждый дополнительный час обучения связан с повышением среднего балла на экзамене на 3,85. Подбирая эту модель линейной регрессии, мы можем количественно оценить точную взаимосвязь между учебными часами и оценкой на экзамене.

Связанный: Как выполнить простую линейную регрессию в Excel

Заключение

Двумерный анализ — один из наиболее часто используемых типов анализа в статистике, поскольку мы часто хотим понять взаимосвязь между двумя переменными.

Используя диаграммы рассеяния, коэффициенты корреляции и простую линейную регрессию, мы можем визуализировать и количественно оценить взаимосвязь между двумя переменными.

Часто эти три метода используются вместе в анализе, чтобы получить полную картину взаимосвязи между двумя переменными. Поэтому рекомендуется ознакомиться с каждым методом.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *