Распределение хи-квадрат в r: dchisq, pchisq, qchisq, rchisq
В этом руководстве объясняется, как использовать распределение хи-квадрат в R, используя следующие функции:
- dchisq : Возвращает значение функции плотности вероятности Хи-квадрат.
- pchisq : Возвращает значение функции кумулятивной плотности хи-квадрат.
- qchisq : возвращает значение функции квантиля хи-квадрат.
- rchisq : генерирует вектор случайных величин, распределенных по хи-квадрату.
Следующие примеры показывают, как использовать каждую из этих функций на практике.
dchisq
Мы часто используем функцию dchisq() вместе с функцией Curve() для построения распределения хи-квадрат с определенным количеством степеней свободы.
Например, мы можем использовать следующий код для построения распределения Хи-квадрат с 5 степенями свободы:
#plot Chi_Square distribution with 5 degrees of freedom curve(dchisq(x, df= 5 ), from= 0 , to= 20 )
По оси X показаны значения статистики теста Хи-квадрат, а по оси Y показано соответствующее значение функции плотности вероятности.
Связанный: Как легко построить график распределения хи-квадрат в R
пчиск
Мы часто используем pchisq(). функция для нахождения значения p , которое соответствует заданной статистике теста хи-квадрат.
Например, предположим, что мы выполняем критерий независимости хи-квадрат и получаем тестовую статистику X2 = 0,86404 с 2 степенями свободы.
Мы можем использовать функцию pchisq() , чтобы найти значение p, соответствующее этой тестовой статистике:
#calculate p-value for given test statistic with 2 degrees of freedom 1-pchisq(0.86404, df= 2 ) [1] 0.6491964
Значение p оказывается равным 0,6491964 .
Мы также можем подтвердить, что это правильно, используя калькулятор хи-квадрат для калькулятора P-значения.
что-нибудь
Мы часто используем qchisq(). функция для нахождения критического значения хи-квадрат, которое соответствует заданному уровню значимости и степеням свободы.
Например, мы можем использовать следующий код, чтобы найти критическое значение хи-квадрат, соответствующее уровню значимости 0,05 с 13 степенями свободы:
qchisq(p= .95 , df= 13 )
[1] 22.36203
Критическое значение оказывается 22,36203 .
Мы также можем подтвердить, что это правильно, с помощью калькулятора критического значения хи-квадрат .
рчиск
Мы часто используем rchisq() функция для генерации списка из n случайных значений, которые следуют распределению хи-квадрат с заданной степенью свободы.
Например, мы можем использовать следующий код для создания списка из 1000 случайных значений, которые следуют распределению Хи-квадрат с 5 степенями свободы:
#make this example reproducible
set. seed ( 0 )
#generate 1000 random values that follow Chi-Square dist with df=5
values <- rchisq(n= 1000 , df= 5 )
#view first five values
head(values)
[1] 8.369701 3.130487 1.985623 5.258747 10.578594 6.360859
Мы также можем использовать функцию hist( ) для создания гистограммы, чтобы визуализировать это распределение значений:
#create histogram to visualize distribution of values
hist(values)
Ось X показывает значения данных, а ось Y показывает частоту этих значений.
Дополнительные ресурсы
В следующих руководствах объясняется, как работать с другими дистрибутивами в R:
Нормальное распределение в R: dnorm, pnorm, qnorm и rnorm.
Биномиальное распределение в R: dbinom, pbinom, qbinom и rbinom.
Распределение рыбы в R: dpois, ppois, qpois и rpois.