Как использовать функцию linearhypothesis() в r
Вы можете использовать функцию LinearHypothesis() из пакета car в R для проверки линейных гипотез в конкретной модели регрессии.
Эта функция использует следующий базовый синтаксис:
linearHypothesis(fit, c(" var1=0 ", " var2=0 "))
В этом конкретном примере проверяется, равны ли нулю коэффициенты регрессии var1 и var2 в модели, называемой подгонкой .
В следующем примере показано, как использовать эту функцию на практике.
Пример. Как использовать функцию LinearHypothesis() в R
Предположим, у нас есть следующий фрейм данных в R, который показывает количество часов, потраченных на обучение, количество сданных практических экзаменов и итоговую оценку экзамена 10 студентов в классе:
#create data frame df <- data.frame(score=c(77, 79, 84, 85, 88, 99, 95, 90, 92, 94), hours=c(1, 1, 2, 3, 2, 4, 4, 2, 3, 3), prac_exams=c(2, 4, 4, 2, 4, 5, 4, 3, 2, 1)) #view data frame df score hours prac_exams 1 77 1 2 2 79 1 4 3 84 2 4 4 85 3 2 5 88 2 4 6 99 4 5 7 95 4 4 8 90 2 3 9 92 3 2 10 94 3 1
Теперь предположим, что мы хотим применить следующую модель множественной линейной регрессии в R:
Оценка за экзамен = β 0 + β 1 (часы) + β 2 (практические экзамены)
Мы можем использовать функцию lm() для адаптации этой модели:
#fit multiple linear regression model fit <- lm(score ~ hours + prac_exams, data=df) #view summary of model summary(fit) Call: lm(formula = score ~ hours + prac_exams, data = df) Residuals: Min 1Q Median 3Q Max -5.8366 -2.0875 0.1381 2.0652 4.6381 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 72.7393 3.9455 18.436 3.42e-07 *** hours 5.8093 1.1161 5.205 0.00125 ** prac_exams 0.3346 0.9369 0.357 0.73150 --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.59 on 7 degrees of freedom Multiple R-squared: 0.8004, Adjusted R-squared: 0.7434 F-statistic: 14.03 on 2 and 7 DF, p-value: 0.003553
Теперь предположим, что мы хотим проверить, равны ли нулю коэффициент часов и prac_exams .
Для этого мы можем использовать функцию LinearHypothesis() :
library (car) #perform hypothesis test for hours=0 and prac_exams=0 linearHypothesis(fit, c(" hours=0 ", " prac_exams=0 ")) Linear hypothesis testing Hypothesis: hours = 0 prac_exams = 0 Model 1: restricted model Model 2: score ~ hours + prac_exams Res.Df RSS Df Sum of Sq F Pr(>F) 1 9 452.10 2 7 90.24 2 361.86 14.035 0.003553 ** --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Проверка гипотезы возвращает следующие значения:
- Статистика F-теста : 14,035
- p-значение : .003553
В этом конкретном тесте гипотезы используются следующие нулевые и альтернативные гипотезы:
- H 0 : Оба коэффициента регрессии равны нулю.
- H A : Хотя бы один коэффициент регрессии не равен нулю.
Поскольку значение p теста (0,003553) меньше 0,05, мы отвергаем нулевую гипотезу.
Другими словами, у нас недостаточно доказательств, чтобы сказать, что коэффициенты регрессии для часов и практических экзаменов равны нулю.
Дополнительные ресурсы
Следующие руководства предоставляют дополнительную информацию о линейной регрессии в R:
Как интерпретировать результаты регрессии в R
Как выполнить простую линейную регрессию в R
Как выполнить множественную линейную регрессию в R
Как выполнить логистическую регрессию в R