Кореляція vs. асоціація: яка різниця?


Два терміни, які іноді використовуються як синоніми, це кореляція та асоціація . Однак у сфері статистики ці два терміни мають дещо різні значення.

Зокрема, коли ми використовуємо слово кореляція , ми зазвичай говоримо про коефіцієнт кореляції Пірсона . Це міра лінійного зв’язку між двома випадковими змінними X і Y. Вона має значення від -1 до 1, де:

  • -1 вказує на абсолютно негативну лінійну кореляцію між двома змінними
  • 0 означає відсутність лінійної кореляції між двома змінними
  • 1 вказує на абсолютно позитивну лінійну кореляцію між двома змінними

І навпаки, коли статистики використовують слово асоціація , вони можуть говорити про будь-який зв’язок між двома змінними, незалежно від того, лінійний чи нелінійний.

Щоб проілюструвати цю думку, розглянемо наступні приклади.

Візуалізація кореляції та асоціації з хмарами точок

Ми використовуємо два слова, щоб описати кореляцію між двома випадковими змінними:

1 напрямок

  • Позитивний: дві випадкові змінні мають позитивну кореляцію, якщо Y має тенденцію до зростання зі збільшенням X.
  • Негативний: дві випадкові змінні мають негативну кореляцію, якщо Y має тенденцію до зменшення зі збільшенням X.

2. Міцність

  • Низька: дві випадкові змінні мають низьку кореляцію, якщо точки на діаграмі розсіювання рідко розсіяні.
  • Сильна: Дві випадкові змінні мають сильну кореляцію, якщо точки на діаграмі розсіювання тісно згруповані разом.

Наступні діаграми розсіювання ілюструють приклади кожного типу кореляції:

Порівняно з кореляцією слово асоціації може сказати нам, чи існує зв’язок між двома випадковими змінними: лінійним чи нелінійним.

Наступні діаграми розсіювання ілюструють деякі приклади:

Кореляція проти асоціації

Діаграма розсіювання у верхньому лівому куті ілюструє квадратичний зв’язок між двома випадковими змінними, тобто зв’язок між двома змінними існує , але він не є лінійним.

Якби ми розрахували кореляцію між двома змінними, вона, ймовірно, була б близькою до нуля, оскільки між ними немає лінійного зв’язку.

Однак просте знання того, що кореляція між двома змінними дорівнює нулю, може ввести в оману, оскільки приховує той факт, що натомість існує нелінійний зв’язок.

Кореляція vs. асоціації: узагальн

Терміни кореляція та асоціація мають такі подібності та відмінності:

Подібності:

  • Обидва терміни використовуються для опису того, чи існує залежність між двома випадковими величинами.
  • Обидва терміни можуть використовувати діаграми розсіювання для аналізу зв’язку між двома випадковими величинами.

відмінності:

  • Кореляція може лише сказати нам, чи дві випадкові змінні мають лінійний зв’язок, тоді як асоціація може сказати нам, чи дві випадкові змінні мають лінійний чи нелінійний зв’язок.
  • Кореляція кількісно визначає зв’язок між двома випадковими змінними, використовуючи число від -1 до 1, але асоціація не використовує конкретне число для кількісної оцінки зв’язку.

Додаткові ресурси

Вступ до коефіцієнта кореляції Пірсона
Знайомство з хмарами точок
Кореляція проти регресії: у чому різниця?

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *