Распределение хи-квадрат в r: dchisq, pchisq, qchisq, rchisq


В этом руководстве объясняется, как использовать распределение хи-квадрат в R, используя следующие функции:

  • dchisq : Возвращает значение функции плотности вероятности Хи-квадрат.
  • pchisq : Возвращает значение функции кумулятивной плотности хи-квадрат.
  • qchisq : возвращает значение функции квантиля хи-квадрат.
  • rchisq : генерирует вектор случайных величин, распределенных по хи-квадрату.

Следующие примеры показывают, как использовать каждую из этих функций на практике.

dchisq

Мы часто используем функцию dchisq() вместе с функцией Curve() для построения распределения хи-квадрат с определенным количеством степеней свободы.

Например, мы можем использовать следующий код для построения распределения Хи-квадрат с 5 степенями свободы:

 #plot Chi_Square distribution with 5 degrees of freedom
curve(dchisq(x, df= 5 ), from= 0 , to= 20 )

По оси X показаны значения статистики теста Хи-квадрат, а по оси Y показано соответствующее значение функции плотности вероятности.

Связанный: Как легко построить график распределения хи-квадрат в R

пчиск

Мы часто используем pchisq().   функция для нахождения значения p , которое соответствует заданной статистике теста хи-квадрат.

Например, предположим, что мы выполняем критерий независимости хи-квадрат и получаем тестовую статистику X2 = 0,86404 с 2 степенями свободы.

Мы можем использовать функцию pchisq() , чтобы найти значение p, соответствующее этой тестовой статистике:

 #calculate p-value for given test statistic with 2 degrees of freedom
1-pchisq(0.86404, df= 2 )

[1] 0.6491964

Значение p оказывается равным 0,6491964 .

Мы также можем подтвердить, что это правильно, используя калькулятор хи-квадрат для калькулятора P-значения.

что-нибудь

Мы часто используем qchisq().   функция для нахождения критического значения хи-квадрат, которое соответствует заданному уровню значимости и степеням свободы.

Например, мы можем использовать следующий код, чтобы найти критическое значение хи-квадрат, соответствующее уровню значимости 0,05 с 13 степенями свободы:

 qchisq(p= .95 , df= 13 )

[1] 22.36203

Критическое значение оказывается 22,36203 .

Мы также можем подтвердить, что это правильно, с помощью калькулятора критического значения хи-квадрат .

рчиск

Мы часто используем rchisq()   функция для генерации списка из n случайных значений, которые следуют распределению хи-квадрат с заданной степенью свободы.

Например, мы можем использовать следующий код для создания списка из 1000 случайных значений, которые следуют распределению Хи-квадрат с 5 степенями свободы:

 #make this example reproducible
set. seed ( 0 ) 

#generate 1000 random values that follow Chi-Square dist with df=5
values <- rchisq(n= 1000 , df= 5 )

#view first five values
head(values)

[1] 8.369701 3.130487 1.985623 5.258747 10.578594 6.360859

Мы также можем использовать функцию hist( ) для создания гистограммы, чтобы визуализировать это распределение значений:

 #create histogram to visualize distribution of values
hist(values)

Ось X показывает значения данных, а ось Y показывает частоту этих значений.

Дополнительные ресурсы

В следующих руководствах объясняется, как работать с другими дистрибутивами в R:

Нормальное распределение в R: dnorm, pnorm, qnorm и rnorm.
Биномиальное распределение в R: dbinom, pbinom, qbinom и rbinom.
Распределение рыбы в R: dpois, ppois, qpois и rpois.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *