R में f आँकड़े के p मान की गणना कैसे करें
एक F परीक्षण एक F आँकड़ा उत्पन्न करता है। आर में एफ आंकड़े से जुड़े पी-वैल्यू को ढूंढने के लिए, आप निम्न कमांड का उपयोग कर सकते हैं:
पीएफ(एफस्टैट, डीएफ1, डीएफ2, लोअर.टेल = गलत)
- fstat – f आँकड़ा का मान
- df1 – स्वतंत्रता की डिग्री 1
- df2 – स्वतंत्रता की डिग्री 2
- निचली पूंछ – एफ वितरण की निचली पूंछ से जुड़ी संभावना वापस करनी है या नहीं। यह डिफ़ॉल्ट रूप से सत्य है.
उदाहरण के लिए, यहां बताया गया है कि स्वतंत्रता की डिग्री 1 = 3 और स्वतंत्रता की डिग्री 2 = 14 के साथ 5 के एफ आंकड़े से जुड़े पी-मूल्य को कैसे खोजा जाए:
pf(5, 3, 14, lower.tail = FALSE) #[1] 0.01457807
एफ-परीक्षण के सबसे आम उपयोगों में से एक प्रतिगमन मॉडल के समग्र महत्व का परीक्षण करना है। निम्नलिखित उदाहरण में, हम दिखाते हैं कि प्रतिगमन मॉडल के लिए एफ सांख्यिकी के पी-मूल्य की गणना कैसे करें।
उदाहरण: एफ सांख्यिकी से पी-मूल्य की गणना
मान लीजिए कि हमारे पास एक डेटासेट है जो अध्ययन किए गए घंटों की कुल संख्या, ली गई तैयारी परीक्षाओं की कुल संख्या और 12 अलग-अलग छात्रों के लिए अंतिम परीक्षा ग्रेड दिखाता है:
#create dataset data <- data.frame(study_hours = c(3, 7, 16, 14, 12, 7, 4, 19, 4, 8, 8, 3), prep_exams = c(2, 6, 5, 2, 7, 4, 4, 2, 8, 4, 1, 3), final_score = c(76, 88, 96, 90, 98, 80, 86, 89, 68, 75, 72, 76)) #view first six rows of dataset head(data) # study_hours prep_exams final_score #1 3 2 76 #2 7 6 88 #3 16 5 96 #4 14 2 90 #5 12 7 98 #6 7 4 80
फिर हम भविष्यवक्ता चर के रूप में अध्ययन के घंटों और प्रारंभिक परीक्षाओं और प्रतिक्रिया चर के रूप में अंतिम स्कोर का उपयोग करके इस डेटा में एक रेखीय प्रतिगमन मॉडल फिट कर सकते हैं। तब हम मॉडल के परिणाम की कल्पना कर सकते हैं:
#fit regression model model <- lm(final_score ~ study_hours + prep_exams, data = data) #view output of the model summary(model) #Call: #lm(formula = final_score ~ study_hours + prep_exams, data = data) # #Residuals: # Min 1Q Median 3Q Max #-13,128 -5,319 2,168 3,458 9,341 # #Coefficients: #Estimate Std. Error t value Pr(>|t|) #(Intercept) 66,990 6,211 10,785 1.9e-06 *** #study_hours 1.300 0.417 3.117 0.0124 * #prep_exams 1.117 1.025 1.090 0.3041 #--- #Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 # #Residual standard error: 7.327 on 9 degrees of freedom #Multiple R-squared: 0.5308, Adjusted R-squared: 0.4265 #F-statistic: 5.091 on 2 and 9 DF, p-value: 0.0332
परिणाम की अंतिम पंक्ति में, हम देख सकते हैं कि समग्र प्रतिगमन मॉडल के लिए एफ आँकड़ा 5.091 है। इस एफ आँकड़े में अंश के लिए 2 डिग्री की स्वतंत्रता और हर के लिए 9 डिग्री की स्वतंत्रता है। आर स्वचालित रूप से गणना करता है कि इस एफ आंकड़े के लिए पी-मान 0.0332 है।
इस समकक्ष पी-वैल्यू की गणना स्वयं करने के लिए, हम निम्नलिखित कोड का उपयोग कर सकते हैं:
pf(5.091, 2, 9, lower.tail = FALSE) #[1] 0.0331947
ध्यान दें कि हमें उपरोक्त रैखिक प्रतिगमन आउटपुट के समान ही उत्तर मिलता है (लेकिन अधिक दशमलव स्थानों के साथ)।