Тест хи-квадрат

В этой статье объясняется, что такое критерий хи-квадрат в статистике и для чего он используется. Вы также узнаете, как выполнить тест хи-квадрат, а также пошаговое решение упражнения.

Что такое тест хи-квадрат?

Критерий хи-квадрат — это статистический тест, используемый для определения наличия статистически значимой разницы между ожидаемой частотой и наблюдаемой частотой.

Логично, что статистика теста хи-квадрат следует распределению хи-квадрат . Поэтому значение тестовой статистики необходимо сравнивать с конкретным значением распределения хи-квадрат. Ниже мы увидим, как выполняется тест хи-квадрат.

Этот тип статистического теста также известен как критерий хи-квадрат Пирсона и иногда обозначается символом распределения хи-квадрат: тест χ² .

Формула теста хи-квадрат

Статистика теста хи-квадрат равна сумме квадратов разностей между наблюдаемыми значениями и ожидаемыми значениями, разделенными на ожидаемые значения.

Итак, формула теста хи-квадрат :

\displaystyle\chi^2=\sum_{i=1}^k\frac{(O_i-E_i)^2}{E_i}

Золото:

  • \chi^2

    — это статистика теста хи-квадрат, которая соответствует распределению хи-квадрат с

    k-1

    степени свободы.

  • k

    — размер выборки данных.

  • O_i

    — наблюдаемое значение для данных i.

  • E_i

    ожидаемое значение для данных i.

Нулевая гипотеза проверки гипотезы с помощью теста хи-квадрат заключается в том, что наблюдаемые значения эквивалентны ожидаемым значениям. С другой стороны, альтернативная гипотеза теста состоит в том, что одно из наблюдаемых значений отличается от ожидаемого значения.

\begin{cases}H_0:O_i=E_i \quad \forall i\\[2ex]H_1:\exists \ O_i\neq E_i \end{cases}

Итак, учитывая уровень значимости

\alpha

, вычисленную статистику теста следует сравнить с критическим значением теста, чтобы определить, следует ли отклонить нулевую гипотезу или альтернативную гипотезу:

  • Если статистика теста меньше критического значения

    \chi_{1-\alpha|k-1}^2

    альтернативная гипотеза отклоняется (и принимается нулевая гипотеза).

  • Если статистика теста превышает критическое значение

    \chi_{1-\alpha|k-1}^2

    , нулевая гипотеза отклоняется (и принимается альтернативная гипотеза).

\begin{array}{l}\text{Si } \chi^2<\chi^2_{1-\alpha|k-1}\text{ se rechaza } H_1\\[3ex]\text{Si } \chi^2>\chi^2_{1-\alpha|k-1}\text{ se rechaza } H_0\end{array}» title=»Rendered by QuickLaTeX.com» height=»70″ width=»243″ style=»vertical-align: 0px;»></p>
</p>
<h2 class= Пример теста хи-квадрат

После того, как мы увидели определение теста хи-квадрат и его формулу, ниже представлен пошаговый пример решения, чтобы вы могли увидеть, как выполняется этот тип статистического теста.

  • Владелец магазина говорит, что 50 % его продаж приходится на товар А, 35 % его продаж приходится на товар Б и 15 % его продаж приходится на товар С. Однако проданные единицы каждого товара — это те, которые ему представлены. в следующей таблице непредвиденных обстоятельств . Проанализируйте, отличаются ли теоретические данные владельца статистически от фактически собранных данных.
Продукт Наблюдаемые продажи (O i )
Продукт А 453
Продукт Б 268
Продукт С 79
Общий 800

Во-первых, нам нужно рассчитать значения, ожидаемые владельцем магазина. Для этого умножаем процент ожидаемых продаж каждого товара на количество достигнутых общих продаж:

\begin{array}{c}E_A=800\cdot 0,5=400\\[2ex]E_B=800\cdot 0,35=280\\[2ex]E_A=800\cdot 0,15=120\end{array}

Таким образом, таблица распределения частот задачи выглядит следующим образом:

Продукт Наблюдаемые продажи (O i ) Ожидаемые продажи (E i )
Продукт А 453 400
Продукт Б 268 280
Продукт С 79 120
Общий 800 800

Теперь, когда мы рассчитали все значения, мы применим формулу теста хи-квадрат для расчета статистики теста:

\begin{array}{c}\displaystyle\chi^2=\sum_{i=1}^k\frac{(O_i-E_i)^2}{E_i}\\[6ex]\chi^2=\cfrac{(453-400)^2}{400}+\cfrac{(268-280)^2}{280}+\cfrac{(79-120)^2}{120}\\[6ex]\chi^2=7,02+0,51+14,00\\[6ex]\chi^2=21,53\end{array}

После расчета значения статистики теста мы используем таблицу распределения хи-квадрат, чтобы найти критическое значение теста. Распределение хи-квадрат имеет

k-1=3-1=2

степеней свободы, поэтому, если мы выберем уровень значимости

\alpha=0,05

критическая ценность теста следующая:

\begin{array}{c}\chi^2_{1-\alpha|k-1}=\ \color{orange}\bm{?}\color{black}\\[4ex]\chi^2_{0,95|2}=5,991\end{array}

Таким образом, статистика теста (21,53) превышает критическое значение теста (5,991), поэтому нулевая гипотеза отклоняется и принимается альтернативная гипотеза. Это означает, что данные сильно различаются и поэтому владелец магазина ожидал других продаж, чем было на самом деле.

21,53>5,991 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Se rechaza } H_0″ title=»Rendered by QuickLaTeX.com» height=»17″ width=»354″ style=»vertical-align: -4px;»></p>
</p>
<h2 class= Интерпретация теста хи-квадрат

Интерпретация критерия Хи-квадрат не может выполняться исключительно на основе полученных результатов теста, ее необходимо сравнивать с критическим значением теста.

Логично, что чем меньше значение рассчитанной тестовой статистики, тем более похожи наблюдаемые данные на ожидаемые. Итак, если результат теста хи-квадрат равен 0, это означает, что наблюдаемые значения и ожидаемые значения абсолютно одинаковы. С другой стороны, чем больше результат теста, тем больше наблюдаемые значения отличаются от ожидаемых.

Однако, чтобы решить, являются ли два набора данных статистически разными или равными, необходимо сравнить рассчитанное значение теста с критическим значением теста, чтобы отвергнуть нулевую гипотезу или альтернативную гипотезу контраста. Если статистика теста меньше критического значения распределения, альтернативная гипотеза отклоняется. С другой стороны, если тестовая статистика превышает критическое значение распределения, нулевая гипотеза отклоняется.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *