Що таке залишки пірсона? (визначення & #038; приклад)
Залишки Пірсона використовуються в тесті хі-квадрат незалежності для аналізу різниці між спостережуваною кількістю клітинок і очікуваною кількістю клітинок у таблиці непередбачуваності.
Формула для обчислення залишку Пірсона :
r ij = (O ij – E ij ) / √ E ij
золото:
- r ij : Залишок Пірсона для клітинки i -го стовпця та j- го рядка
- O ij : значення, що спостерігається для клітинки i -го стовпця та j- го рядка
- E ij : очікуване значення для клітинки i- го стовпця та j- го рядка
Подібною мірою є стандартизований (скоригований) залишок Пірсона , який обчислюється таким чином:
r ij = (O ij – E ij ) / √ E ij (1-n i+ )(1-n +j )
золото:
- r ij : Залишок Пірсона для клітинки i -го стовпця та j- го рядка
- O ij : значення, що спостерігається для клітинки i -го стовпця та j- го рядка
- E ij : очікуване значення для клітинки i- го стовпця та j- го рядка
- p i+ : загальна сума рядка, поділена на загальну суму
- p + j : загальна сума стовпця, поділена на загальну суму
Стандартизовані залишки Пірсона зазвичай розподіляються із середнім значенням 0 і стандартним відхиленням 1. Будь-який стандартизований залишок Пірсона з абсолютним значенням вище певних порогів (наприклад, 2 або 3) вказує на відсутність відповідності.
У наступному прикладі показано, як обчислити залишки Пірсона на практиці.
Приклад: обчислення залишків Пірсона
Припустімо, що дослідники хочуть використати тест хі-квадрат незалежності, щоб визначити, чи пов’язана стать із перевагою політичної партії.
Вони вирішують взяти просту випадкову вибірку з 500 виборців і запитати їх про їхні переваги щодо політичної партії.
У наступній таблиці непередбачених обставин представлено результати опитування:
республіканець | демократ | Незалежний | Всього | |
Чоловік | 120 | 90 | 40 | 250 |
Жінка | 110 | 95 | 45 | 250 |
Всього | 230 | 185 | 85 | 500 |
Перш ніж обчислювати залишки Пірсона, ми повинні спочатку обчислити очікувані підрахунки для кожної комірки в таблиці непередбачених обставин. Для цього ми можемо використати таку формулу:
Очікуване значення = (сума рядків * сума стовпців) / сума таблиці.
Наприклад, очікуване значення для чоловіків-республіканців таке: (230*250) / 500 = 115 .
Ми можемо повторити цю формулу, щоб отримати очікуване значення для кожної клітинки таблиці:
республіканець | демократ | Незалежний | Всього | |
Чоловік | 115 | 92.5 | 42.5 | 250 |
Жінка | 115 | 92.5 | 42.5 | 250 |
Всього | 230 | 185 | 85 | 500 |
Тоді ми можемо обчислити нев’язку Пірсона для кожної клітинки таблиці.
Наприклад, залишок Пірсона для осередку, що містить республіканців, буде розрахований таким чином:
- r ij = (O ij – E ij ) / √ E ij
- r ij = (120 – 115) / √ 115
- r ij = 0,466
Ми можемо повторити цю формулу, щоб отримати нев’язку Пірсона для кожної клітинки таблиці:
республіканець | демократ | Незалежний | |
Чоловік | 0,446 | -0,259 | -0,383 |
Жінка | -0,446 | 0,259 | 0,383 |
Тоді ми можемо обчислити стандартизований залишок Пірсона для кожної комірки в таблиці.
Наприклад, стандартизований залишок Пірсона для камери, що містить республіканців, буде розрахований таким чином:
- r ij = (O ij – E ij ) / √ E ij (1-p i+ )(1-p +j )
- r ij = (120 – 115) / √ 115(1-250/500)(1-230/500)
- r ij = 0,897
Ми можемо повторити цю формулу, щоб отримати стандартизований залишок Пірсона для кожної комірки в таблиці:
республіканець | демократ | Незалежний | |
Чоловік | 0,897 | -0,463 | -0,595 |
Жінка | -0,897 | 0,463 | 0,595 |
Ми бачимо, що жоден із стандартизованих залишків Пірсона не має абсолютного значення, що перевищує 3, що вказує на те, що жодна з клітинок не сприяє значній невідповідності.
Якщо ми використаємо цей онлайн-калькулятор , щоб виконати тест хі-квадрат на незалежність, ми виявимо, що p-значення тесту становить 0,649198 .
Оскільки це p-значення не менше 0,05, ми не маємо достатніх доказів, щоб стверджувати, що існує зв’язок між статтю та перевагами політичної партії.
Додаткові ресурси
У наступних посібниках пояснюється, як виконати тест хі-квадрат незалежності за допомогою різного статистичного програмного забезпечення:
Вступ до тесту незалежності хі-квадрат
Як виконати тест незалежності хі-квадрат в Excel
Як виконати тест незалежності хі-квадрат у R
Калькулятор тесту хі-квадрат незалежності