Covariance.p проти covariance.s в excel: у чому різниця?
У статистиці коваріація — це спосіб вимірювання того, як зміни в одній змінній пов’язані зі змінами в іншій змінній.
Позитивне значення коваріації вказує на те, що збільшення однієї змінної пов’язане зі збільшенням іншої змінної.
Від’ємне значення вказує на те, що збільшення однієї змінної пов’язане зі зменшенням іншої змінної.
Для обчислення коваріації в Excel можна використовувати дві різні функції:
1. COVARIANCE.P: Ця функція обчислює коваріацію сукупності. Використовуйте цю функцію, коли діапазон значень представляє всю сукупність.
Ця функція використовує таку формулу:
Коваріація сукупності = Σ(x i – x )(y i – y ) / n
золото:
- Σ: грецький символ, що означає «сума»
- x i : i -те значення змінної x
- x : середнє значення змінної x
- y i : i-е значення змінної y
- y : середнє значення змінної y
- n: Загальна кількість спостережень
2. COVARIANCE.S: Ця функція обчислює вибіркову коваріацію. Використовуйте цю функцію, коли діапазон значень представляє вибірку значень, а не всю сукупність.
Ця функція використовує таку формулу:
Вибіркова коваріація = Σ(x i – x )(y i – y ) / (n-1)
золото:
- Σ: грецький символ, що означає «сума»
- x i : i -те значення змінної x
- x : середнє значення змінної x
- y i : i-е значення змінної y
- y : середнє значення змінної y
- n: Загальна кількість спостережень
Зверніть увагу на тонку різницю між двома формулами: COVARIANCE.P ділить на n , а COVARIANCE.S ділить на n-1 .
З цієї причини формула COVARIANCE.S завжди вироблятиме більше значення, оскільки вона ділиться на менше значення.
У наступному прикладі показано, як використовувати кожну формулу на практиці.
Приклад: COVARIANCE.P проти COVARIANCE.S в Excel
Припустімо, у нас є такий набір даних у Excel, який показує очки та гольові передачі 15 різних баскетболістів:
На наступному знімку екрана показано, як обчислити коваріацію між очками та передачами за допомогою двох різних формул коваріації:
Коваріація вибірки виявляється 15,69 , а коваріація генеральної сукупності – 14,64 .
Як згадувалося раніше, вибіркова коваріація завжди буде більшою, ніж сукупна коваріація.
Коли використовувати COVARIANCE.P або COVARIANCE.S
У більшості випадків ми не можемо зібрати дані для всієї сукупності. Тому ми збираємо дані лише для вибірки населення.
Отже, ми майже завжди використовуємо COVARIANCE.S для обчислення коваріації набору даних, оскільки наш набір даних зазвичай представляє вибірку.
У рідкісних випадках, коли ваші дані представляють цілу сукупність, замість цього можна використовувати функцію COVARIANCE.P .
Додаткові ресурси
У наступних посібниках пояснюється різниця між іншими часто використовуваними функціями Excel:
STDEV.P проти STDEV.S в Excel: у чому різниця?
PERCENTILE.EXC проти PERCENTILE.INC в Excel: у чому різниця?
QUARTILE.EXC проти QUARTILE.INC в Excel: у чому різниця?