Как вручную рассчитать коэффициент корреляции пирсона


Коэффициент корреляции Пирсона измеряет линейную связь между двумя переменными.

Он всегда принимает значение от -1 до 1, где:

  • -1 указывает на совершенно отрицательную линейную корреляцию между двумя переменными.
  • 0 указывает на отсутствие линейной корреляции между двумя переменными.
  • 1 указывает на совершенно положительную линейную корреляцию между двумя переменными.

Формула для расчета коэффициента корреляции Пирсона, обозначаемого r , выглядит следующим образом:

Источник: Википедия

В этом руководстве представлен пошаговый пример того, как вручную рассчитать коэффициент корреляции Пирсона для следующего набора данных:

Шаг 1. Рассчитайте среднее значение X и Y.

Сначала мы рассчитаем среднее значение X и Y:

Шаг 2: Рассчитайте разницу между средними значениями

Далее мы рассчитаем разницу между каждым из отдельных значений X и Y и их соответствующими средними значениями:

Шаг 3: Рассчитайте оставшиеся значения

Далее рассчитаем остальные значения, необходимые для завершения формулы коэффициента корреляции Пирсона:

Шаг 4: Подсчитайте суммы

Далее посчитаем суммы трех последних столбцов:

Шаг 5: Рассчитайте коэффициент корреляции Пирсона

Теперь мы просто подставим суммы из предыдущего шага в формулу коэффициента корреляции Пирсона:

Коэффициент корреляции Пирсона вручную

Коэффициент корреляции Пирсона оказывается равным 0,947 .

Поскольку это значение близко к 1, это указывает на то, что X и Y сильно положительно коррелируют.

Другими словами, по мере увеличения значения X значение Y также увеличивается вполне предсказуемым образом.

Дополнительные ресурсы

Введение в коэффициент корреляции Пирсона
Как найти доверительный интервал для коэффициента корреляции

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *