Что такое остатки пирсона? (определение & #038; пример)
Остатки Пирсона используются в тесте независимости хи-квадрат для анализа разницы между наблюдаемым количеством ячеек и ожидаемым количеством ячеек в таблице непредвиденных обстоятельств.
Формула расчета остатка Пирсона :
р ij знак равно (O ij – E ij ) / √ E ij
Золото:
- r ij : Остаток Пирсона для ячейки i -го столбца и j- й строки.
- O ij : значение, наблюдаемое для ячейки i -го столбца и j- й строки.
- E ij : ожидаемое значение для ячейки i -го столбца и j- й строки.
Аналогичной мерой является стандартизированный (скорректированный) остаток Пирсона , который рассчитывается следующим образом:
р ij = (O ij – E ij ) / √ E ij (1-n i+ )(1-n +j )
Золото:
- r ij : Остаток Пирсона для ячейки i -го столбца и j- й строки.
- O ij : значение, наблюдаемое для ячейки i -го столбца и j- й строки.
- E ij : ожидаемое значение для ячейки i -го столбца и j- й строки.
- p i+ : общая сумма строк, деленная на общую сумму
- p + j : общая сумма столбца, разделенная на общую сумму.
Стандартизированные остатки Пирсона обычно распределяются со средним значением 0 и стандартным отклонением 1. Любой стандартизированный остаток Пирсона с абсолютным значением выше определенных пороговых значений (например, 2 или 3) указывает на несоответствие.
В следующем примере показано, как на практике рассчитать остатки Пирсона.
Пример: расчет остатков Пирсона
Предположим, исследователи хотят использовать критерий независимости хи-квадрат, чтобы определить, связан ли пол с предпочтением той или иной политической партии.
Они решают взять простую случайную выборку из 500 избирателей и спросить их об их предпочтениях в отношении политических партий.
В следующей таблице непредвиденных обстоятельств представлены результаты опроса:
республиканец | Демократ | Независимый | Общий | |
Мужской | 120 | 90 | 40 | 250 |
Женский | 110 | 95 | 45 | 250 |
Общий | 230 | 185 | 85 | 500 |
Прежде чем рассчитывать остатки Пирсона, мы должны сначала рассчитать ожидаемое количество для каждой ячейки в таблице непредвиденных обстоятельств. Для этого мы можем использовать следующую формулу:
Ожидаемое значение = (сумма строк * сумма столбцов) / сумма таблицы.
Например, ожидаемое значение для мужчин-республиканцев составляет: (230*250)/500 = 115 .
Мы можем повторить эту формулу, чтобы получить ожидаемое значение для каждой ячейки таблицы:
республиканец | Демократ | Независимый | Общий | |
Мужской | 115 | 92,5 | 42,5 | 250 |
Женский | 115 | 92,5 | 42,5 | 250 |
Общий | 230 | 185 | 85 | 500 |
Затем мы можем вычислить остаток Пирсона для каждой ячейки таблицы.
Например, остаток Пирсона для ячейки, содержащей мужчин-республиканцев, будет рассчитываться следующим образом:
- р ij знак равно (O ij – E ij ) / √ E ij
- r ij = (120 – 115) / √ 115
- р ij = 0,466
Мы можем повторить эту формулу, чтобы получить остаток Пирсона для каждой ячейки таблицы:
республиканец | Демократ | Независимый | |
Мужской | 0,446 | -0,259 | -0,383 |
Женский | -0,446 | 0,259 | 0,383 |
Затем мы можем рассчитать стандартизированный остаток Пирсона для каждой ячейки таблицы.
Например, стандартизированный остаток Пирсона для ячейки, содержащей мужчин-республиканцев, будет рассчитываться следующим образом:
- р ij = (O ij – E ij ) / √ E ij (1-p i+ )(1-p +j )
- r ij = (120 – 115) / √ 115(1-250/500)(1-230/500)
- р ij = 0,897
Мы можем повторить эту формулу, чтобы получить стандартизированный остаток Пирсона для каждой ячейки таблицы:
республиканец | Демократ | Независимый | |
Мужской | 0,897 | -0,463 | -0,595 |
Женский | -0,897 | 0,463 | 0,595 |
Мы видим, что ни один из стандартизированных остатков Пирсона не имеет абсолютного значения больше 3, что указывает на то, что ни одна из ячеек не способствует значительному отсутствию соответствия.
Если мы воспользуемся этим онлайн-калькулятором для выполнения теста независимости хи-квадрат, мы обнаружим, что p-значение теста составляет 0,649198 .
Поскольку это значение p не меньше 0,05, у нас нет достаточных доказательств, чтобы сказать, что существует связь между полом и предпочтениями политических партий.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнить критерий независимости хи-квадрат с использованием различного статистического программного обеспечения:
Введение в тест независимости хи-квадрат
Как выполнить тест независимости хи-квадрат в Excel
Как выполнить тест независимости хи-квадрат в R
Калькулятор критерия независимости хи-квадрат