Корреляция против. ассоциация: в чем разница?


Два термина, которые иногда используются как взаимозаменяемые, — это корреляция и ассоциация . Однако в области статистики эти два термина имеют несколько разное значение.

В частности, когда мы используем слово корреляция , мы обычно говорим о коэффициенте корреляции Пирсона . Это мера линейной связи между двумя случайными величинами X и Y. Она имеет значение от -1 до 1, где:

  • -1 указывает на совершенно отрицательную линейную корреляцию между двумя переменными.
  • 0 указывает на отсутствие линейной корреляции между двумя переменными.
  • 1 указывает на совершенно положительную линейную корреляцию между двумя переменными.

И наоборот, когда статистики используют слово « ассоциация» , они могут иметь в виду любую связь между двумя переменными, будь то линейную или нелинейную.

Чтобы проиллюстрировать эту идею, рассмотрим следующие примеры.

Визуализация корреляции и связи с облаками точек

Мы используем два слова для описания корреляции между двумя случайными величинами:

1 направление

  • Положительный: две случайные величины имеют положительную корреляцию, если Y имеет тенденцию увеличиваться по мере увеличения X.
  • Отрицательный: две случайные величины имеют отрицательную корреляцию, если Y имеет тенденцию уменьшаться по мере увеличения X.

2. Сила

  • Низкая: две случайные величины имеют низкую корреляцию, если точки на диаграмме рассеяния разбросаны редко.
  • Сильная: две случайные величины имеют сильную корреляцию, если точки на диаграмме рассеяния тесно сгруппированы вместе.

Следующие диаграммы рассеяния иллюстрируют примеры каждого типа корреляции:

По сравнению с корреляцией, словесная ассоциация может сказать нам, существует ли связь между двумя случайными величинами: линейная или нелинейная.

Следующие диаграммы рассеяния иллюстрируют некоторые примеры:

Корреляция против ассоциации

Диаграмма рассеяния в верхнем левом углу иллюстрирует квадратичную зависимость между двумя случайными величинами, что означает, что связь между двумя переменными существует , но она не является линейной.

Если бы мы вычислили корреляцию между двумя переменными, она, вероятно, была бы близка к нулю, поскольку между ними нет линейной зависимости.

Однако простое знание того, что корреляция между двумя переменными равна нулю, может ввести в заблуждение, поскольку скрывает тот факт, что вместо этого существует нелинейная связь.

Корреляция против. ассоциация: резюме

Термины корреляция и ассоциация имеют следующие сходства и различия:

Сходства:

  • Оба термина используются для описания того, существует ли связь между двумя случайными величинами.
  • Оба термина могут использовать диаграммы рассеяния для анализа взаимосвязи между двумя случайными величинами.

Отличия:

  • Корреляция может только сказать нам, имеют ли две случайные величины линейную связь, тогда как ассоциация может сказать нам, имеют ли две случайные величины линейную или нелинейную связь.
  • Корреляция количественно определяет связь между двумя случайными величинами, используя число от -1 до 1, но ассоциация не использует конкретное число для количественной оценки связи.

Дополнительные ресурсы

Введение в коэффициент корреляции Пирсона
Введение в облака точек
Корреляция и регрессия: в чем разница?

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *