आर में लीनियरहाइपोथिसिस () फ़ंक्शन का उपयोग कैसे करें


आप एक विशिष्ट प्रतिगमन मॉडल में रैखिक परिकल्पना का परीक्षण करने के लिए आर में कार पैकेज से लीनियरहाइपोथिसिस () फ़ंक्शन का उपयोग कर सकते हैं।

यह फ़ंक्शन निम्नलिखित मूल सिंटैक्स का उपयोग करता है:

 linearHypothesis(fit, c(" var1=0 ", " var2=0 "))

यह विशेष उदाहरण परीक्षण करता है कि फिट नामक मॉडल में प्रतिगमन गुणांक var1 और var2 संयुक्त रूप से शून्य के बराबर हैं या नहीं।

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस फ़ंक्शन का उपयोग कैसे करें।

उदाहरण: आर में लीनियरहाइपोथिसिस () फ़ंक्शन का उपयोग कैसे करें

मान लीजिए कि हमारे पास आर में निम्नलिखित डेटा फ्रेम है जो अध्ययन में बिताए गए घंटों की संख्या, ली गई अभ्यास परीक्षाओं की संख्या और कक्षा में 10 छात्रों के अंतिम परीक्षा स्कोर को दर्शाता है:

 #create data frame
df <- data.frame(score=c(77, 79, 84, 85, 88, 99, 95, 90, 92, 94),
                 hours=c(1, 1, 2, 3, 2, 4, 4, 2, 3, 3),
                 prac_exams=c(2, 4, 4, 2, 4, 5, 4, 3, 2, 1))

#view data frame
df

   score hours prac_exams
1 77 1 2
2 79 1 4
3 84 2 4
4 85 3 2
5 88 2 4
6 99 4 5
7 95 4 4
8 90 2 3
9 92 3 2
10 94 3 1

अब मान लीजिए कि हम निम्नलिखित एकाधिक रैखिक प्रतिगमन मॉडल को आर में फिट करना चाहते हैं:

परीक्षा स्कोर = β 0 + β 1 (घंटे) + β 2 (व्यावहारिक परीक्षा)

हम इस मॉडल को अनुकूलित करने के लिए lm() फ़ंक्शन का उपयोग कर सकते हैं:

 #fit multiple linear regression model
fit <- lm(score ~ hours + prac_exams, data=df)

#view summary of model
summary(fit)

Call:
lm(formula = score ~ hours + prac_exams, data = df)

Residuals:
    Min 1Q Median 3Q Max 
-5.8366 -2.0875 0.1381 2.0652 4.6381 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 72.7393 3.9455 18.436 3.42e-07 ***
hours 5.8093 1.1161 5.205 0.00125 ** 
prac_exams 0.3346 0.9369 0.357 0.73150    
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.59 on 7 degrees of freedom
Multiple R-squared: 0.8004, Adjusted R-squared: 0.7434 
F-statistic: 14.03 on 2 and 7 DF, p-value: 0.003553

अब मान लीजिए कि हम परीक्षण करना चाहते हैं कि घंटे का गुणांक और अभ्यास परीक्षा दोनों शून्य हैं या नहीं।

ऐसा करने के लिए हम LinearHypothsis() फ़ंक्शन का उपयोग कर सकते हैं:

 library (car)

#perform hypothesis test for hours=0 and prac_exams=0
linearHypothesis(fit, c(" hours=0 ", " prac_exams=0 "))

Linear hypothesis testing

Hypothesis:
hours = 0
prac_exams = 0

Model 1: restricted model
Model 2: score ~ hours + prac_exams

  Res.Df RSS Df Sum of Sq F Pr(>F)   
1 9 452.10                                
2 7 90.24 2 361.86 14.035 0.003553 **
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

परिकल्पना परीक्षण निम्नलिखित मान लौटाता है:

  • एफ-परीक्षण आँकड़ा : 14.035
  • पी-वैल्यू : .003553

यह विशेष परिकल्पना परीक्षण निम्नलिखित शून्य और वैकल्पिक परिकल्पनाओं का उपयोग करता है:

  • एच 0 : दोनों प्रतिगमन गुणांक शून्य के बराबर हैं।
  • एच : कम से कम एक प्रतिगमन गुणांक शून्य के बराबर नहीं है।

चूँकि परीक्षण का पी-मान (0.003553) 0.05 से कम है, हम शून्य परिकल्पना को अस्वीकार करते हैं।

दूसरे शब्दों में, हमारे पास यह कहने के लिए पर्याप्त सबूत नहीं हैं कि घंटों और अभ्यास परीक्षा दोनों के लिए प्रतिगमन गुणांक शून्य के बराबर हैं।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल आर में रैखिक प्रतिगमन के बारे में अतिरिक्त जानकारी प्रदान करते हैं:

आर में प्रतिगमन आउटपुट की व्याख्या कैसे करें
आर में सरल रैखिक प्रतिगमन कैसे करें
आर में मल्टीपल लीनियर रिग्रेशन कैसे करें
आर में लॉजिस्टिक रिग्रेशन कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *