आंशिक एफ परीक्षण क्या है?
आंशिक एफ-परीक्षण का उपयोग यह निर्धारित करने के लिए किया जाता है कि प्रतिगमन मॉडल और उसी मॉडल के नेस्टेड संस्करण के बीच सांख्यिकीय रूप से महत्वपूर्ण अंतर है या नहीं।
एक नेस्टेड मॉडल बस एक मॉडल है जिसमें समग्र प्रतिगमन मॉडल में भविष्यवक्ता चर का एक सबसेट शामिल होता है।
उदाहरण के लिए, मान लें कि हमारे पास चार भविष्यवक्ता चर के साथ निम्नलिखित प्रतिगमन मॉडल है:
वाई = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε
नेस्टेड मॉडल का एक उदाहरण निम्नलिखित मॉडल होगा जिसमें केवल दो मूल भविष्यवक्ता चर होंगे:
वाई = β 0 + β 1 x 1 + β 2 x 2 + ε
यह निर्धारित करने के लिए कि क्या ये दोनों मॉडल काफी भिन्न हैं, हम आंशिक एफ-परीक्षण कर सकते हैं।
आंशिक एफ परीक्षण: मूल बातें
आंशिक एफ-परीक्षण निम्नलिखित एफ-परीक्षण आंकड़ों की गणना करता है:
एफ = (( कम आरएसएस – पूर्ण आरएसएस)/पी) / ( पूर्ण आरएसएस/एनके)
सोना:
- कम आरएसएस : कम किए गए (यानी “नेस्टेड”) मॉडल के वर्गों का अवशिष्ट योग।
- RSS पूर्ण : पूर्ण मॉडल के वर्गों का अवशिष्ट योग।
- पी: पूर्ण मॉडल से हटाए गए भविष्यवक्ताओं की संख्या।
- n: डेटासेट में अवलोकनों की कुल संख्या।
- k: पूर्ण मॉडल में गुणांकों की संख्या (इंटरसेप्ट सहित)।
ध्यान दें कि पूर्ण मॉडल के लिए वर्गों का अवशिष्ट योग हमेशा छोटा होगा क्योंकि भविष्यवक्ताओं को जोड़ने से हमेशा त्रुटि में कुछ कमी आएगी।
तो एक आंशिक एफ-परीक्षण अनिवार्य रूप से परीक्षण करता है कि क्या आपके द्वारा पूर्ण मॉडल से हटाए गए भविष्यवक्ताओं का समूह वास्तव में उपयोगी है और उन्हें पूर्ण मॉडल में शामिल किया जाना चाहिए।
यह परीक्षण निम्नलिखित शून्य और वैकल्पिक परिकल्पनाओं का उपयोग करता है:
एच 0 : पूर्ण मॉडल से हटाए गए सभी गुणांक शून्य हैं।
एच ए : संपूर्ण मॉडल से हटाए गए गुणांकों में से कम से कम एक गैर-शून्य है।
यदि एफ-परीक्षण आंकड़ों के अनुरूप पी-मान एक निश्चित स्तर के महत्व (जैसे 0.05) से नीचे है, तो हम शून्य परिकल्पना को अस्वीकार कर सकते हैं और निष्कर्ष निकाल सकते हैं कि पूर्ण मॉडल से हटाए गए गुणांकों में से कम से कम एक महत्वपूर्ण है।
आंशिक एफ परीक्षण: एक उदाहरण
व्यवहार में, हम आंशिक एफ परीक्षण करने के लिए निम्नलिखित चरणों का उपयोग करते हैं:
1. पूर्ण प्रतिगमन मॉडल को फ़िट करें और RSS पूर्ण की गणना करें।
2. नेस्टेड रिग्रेशन मॉडल को फिट करें और कम आरएसएस की गणना करें।
3. पूर्ण और संक्षिप्त मॉडल की तुलना करने के लिए एक एनोवा निष्पादित करें, जो मॉडलों की तुलना करने के लिए आवश्यक एफ-परीक्षण आंकड़े तैयार करेगा।
उदाहरण के लिए, निम्नलिखित कोड दिखाता है कि अंतर्निहित एमटीकार्स डेटासेट से डेटा का उपयोग करके आर में निम्नलिखित दो प्रतिगमन मॉडल को कैसे फिट किया जाए:
पूर्ण मॉडल: एमपीजी = β 0 + β 1 उपलब्ध + β 2 कार्ब + β 3 एचपी + β 4 सिलेंडर
मॉडल: एमपीजी = β 0 + β 1 उपलब्ध + β 2 कार्ब
#fit full model model_full <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars) #fit reduced model model_reduced <- lm(mpg ~ disp + carb, data = mtcars) #perform ANOVA to test for differences in models anova(model_reduced, model_full) Analysis of Variance Table Model 1: mpg ~ available + carb Model 2: mpg ~ disp + carb + hp + cyl Res.Df RSS Df Sum of Sq F Pr(>F) 1 29 254.82 2 27 238.71 2 16.113 0.9113 0.414
परिणाम से, हम देख सकते हैं कि एनोवा का एफ परीक्षण आँकड़ा 0.9113 है और संबंधित पी-मान 0.414 है।
चूँकि यह पी-मान 0.05 से कम नहीं है, हम शून्य परिकल्पना को अस्वीकार करने में विफल रहेंगे। इसका मतलब यह है कि हमारे पास यह कहने के लिए पर्याप्त सबूत नहीं हैं कि एचपी या सिलेंडर भविष्यवक्ता चर में से कोई भी सांख्यिकीय रूप से महत्वपूर्ण है।
दूसरे शब्दों में, प्रतिगमन मॉडल में एचपी और सिलेंडर जोड़ने से मॉडल फिट में उल्लेखनीय सुधार नहीं होता है।