आंशिक एफ परीक्षण क्या है?


आंशिक एफ-परीक्षण का उपयोग यह निर्धारित करने के लिए किया जाता है कि प्रतिगमन मॉडल और उसी मॉडल के नेस्टेड संस्करण के बीच सांख्यिकीय रूप से महत्वपूर्ण अंतर है या नहीं।

एक नेस्टेड मॉडल बस एक मॉडल है जिसमें समग्र प्रतिगमन मॉडल में भविष्यवक्ता चर का एक सबसेट शामिल होता है।

उदाहरण के लिए, मान लें कि हमारे पास चार भविष्यवक्ता चर के साथ निम्नलिखित प्रतिगमन मॉडल है:

वाई = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε

नेस्टेड मॉडल का एक उदाहरण निम्नलिखित मॉडल होगा जिसमें केवल दो मूल भविष्यवक्ता चर होंगे:

वाई = β 0 + β 1 x 1 + β 2 x 2 + ε

यह निर्धारित करने के लिए कि क्या ये दोनों मॉडल काफी भिन्न हैं, हम आंशिक एफ-परीक्षण कर सकते हैं।

आंशिक एफ परीक्षण: मूल बातें

आंशिक एफ-परीक्षण निम्नलिखित एफ-परीक्षण आंकड़ों की गणना करता है:

एफ = (( कम आरएसएस – पूर्ण आरएसएस)/पी) / ( पूर्ण आरएसएस/एनके)

सोना:

  • कम आरएसएस : कम किए गए (यानी “नेस्टेड”) मॉडल के वर्गों का अवशिष्ट योग।
  • RSS पूर्ण : पूर्ण मॉडल के वर्गों का अवशिष्ट योग।
  • पी: पूर्ण मॉडल से हटाए गए भविष्यवक्ताओं की संख्या।
  • n: डेटासेट में अवलोकनों की कुल संख्या।
  • k: पूर्ण मॉडल में गुणांकों की संख्या (इंटरसेप्ट सहित)।

ध्यान दें कि पूर्ण मॉडल के लिए वर्गों का अवशिष्ट योग हमेशा छोटा होगा क्योंकि भविष्यवक्ताओं को जोड़ने से हमेशा त्रुटि में कुछ कमी आएगी।

तो एक आंशिक एफ-परीक्षण अनिवार्य रूप से परीक्षण करता है कि क्या आपके द्वारा पूर्ण मॉडल से हटाए गए भविष्यवक्ताओं का समूह वास्तव में उपयोगी है और उन्हें पूर्ण मॉडल में शामिल किया जाना चाहिए।

यह परीक्षण निम्नलिखित शून्य और वैकल्पिक परिकल्पनाओं का उपयोग करता है:

एच 0 : पूर्ण मॉडल से हटाए गए सभी गुणांक शून्य हैं।

एच : संपूर्ण मॉडल से हटाए गए गुणांकों में से कम से कम एक गैर-शून्य है।

यदि एफ-परीक्षण आंकड़ों के अनुरूप पी-मान एक निश्चित स्तर के महत्व (जैसे 0.05) से नीचे है, तो हम शून्य परिकल्पना को अस्वीकार कर सकते हैं और निष्कर्ष निकाल सकते हैं कि पूर्ण मॉडल से हटाए गए गुणांकों में से कम से कम एक महत्वपूर्ण है।

आंशिक एफ परीक्षण: एक उदाहरण

व्यवहार में, हम आंशिक एफ परीक्षण करने के लिए निम्नलिखित चरणों का उपयोग करते हैं:

1. पूर्ण प्रतिगमन मॉडल को फ़िट करें और RSS पूर्ण की गणना करें।

2. नेस्टेड रिग्रेशन मॉडल को फिट करें और कम आरएसएस की गणना करें।

3. पूर्ण और संक्षिप्त मॉडल की तुलना करने के लिए एक एनोवा निष्पादित करें, जो मॉडलों की तुलना करने के लिए आवश्यक एफ-परीक्षण आंकड़े तैयार करेगा।

उदाहरण के लिए, निम्नलिखित कोड दिखाता है कि अंतर्निहित एमटीकार्स डेटासेट से डेटा का उपयोग करके आर में निम्नलिखित दो प्रतिगमन मॉडल को कैसे फिट किया जाए:

पूर्ण मॉडल: एमपीजी = β 0 + β 1 उपलब्ध + β 2 कार्ब + β 3 एचपी + β 4 सिलेंडर

मॉडल: एमपीजी = β 0 + β 1 उपलब्ध + β 2 कार्ब

 #fit full model
model_full <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars)

#fit reduced model
model_reduced <- lm(mpg ~ disp + carb, data = mtcars)

#perform ANOVA to test for differences in models
anova(model_reduced, model_full)

Analysis of Variance Table

Model 1: mpg ~ available + carb
Model 2: mpg ~ disp + carb + hp + cyl
  Res.Df RSS Df Sum of Sq F Pr(>F)
1 29 254.82                           
2 27 238.71 2 16.113 0.9113 0.414

परिणाम से, हम देख सकते हैं कि एनोवा का एफ परीक्षण आँकड़ा 0.9113 है और संबंधित पी-मान 0.414 है।

चूँकि यह पी-मान 0.05 से कम नहीं है, हम शून्य परिकल्पना को अस्वीकार करने में विफल रहेंगे। इसका मतलब यह है कि हमारे पास यह कहने के लिए पर्याप्त सबूत नहीं हैं कि एचपी या सिलेंडर भविष्यवक्ता चर में से कोई भी सांख्यिकीय रूप से महत्वपूर्ण है।

दूसरे शब्दों में, प्रतिगमन मॉडल में एचपी और सिलेंडर जोड़ने से मॉडल फिट में उल्लेखनीय सुधार नहीं होता है।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *