आंशिक एफ परीक्षण क्या है?

द्वारा डॉ. बेंजामिन एंडरसन जुलाई 27, 2023 मार्गदर्शक शून्य टिप्पणियां

आंशिक एफ-परीक्षण का उपयोग यह निर्धारित करने के लिए किया जाता है कि प्रतिगमन मॉडल और उसी मॉडल के नेस्टेड संस्करण के बीच सांख्यिकीय रूप से महत्वपूर्ण अंतर है या नहीं।

एक नेस्टेड मॉडल बस एक मॉडल है जिसमें समग्र प्रतिगमन मॉडल में भविष्यवक्ता चर का एक सबसेट शामिल होता है।

उदाहरण के लिए, मान लें कि हमारे पास चार भविष्यवक्ता चर के साथ निम्नलिखित प्रतिगमन मॉडल है:

वाई = β ₀ + β ₁ x ₁ + β ₂ x ₂ + β ₃ x ₃ + β ₄ x ₄ + ε

नेस्टेड मॉडल का एक उदाहरण निम्नलिखित मॉडल होगा जिसमें केवल दो मूल भविष्यवक्ता चर होंगे:

वाई = β ₀ + β ₁ x ₁ + β ₂ x ₂ + ε

यह निर्धारित करने के लिए कि क्या ये दोनों मॉडल काफी भिन्न हैं, हम आंशिक एफ-परीक्षण कर सकते हैं।

आंशिक एफ परीक्षण: मूल बातें

आंशिक एफ-परीक्षण निम्नलिखित एफ-परीक्षण आंकड़ों की गणना करता है:

एफ = (( _कम आरएसएस – _{पूर्ण} आरएसएस)/पी) / ( _{पूर्ण} आरएसएस/एनके)

सोना:

_कम आरएसएस : कम किए गए (यानी “नेस्टेड”) मॉडल के वर्गों का अवशिष्ट योग।
RSS _{पूर्ण} : पूर्ण मॉडल के वर्गों का अवशिष्ट योग।
पी: पूर्ण मॉडल से हटाए गए भविष्यवक्ताओं की संख्या।
n: डेटासेट में अवलोकनों की कुल संख्या।
k: पूर्ण मॉडल में गुणांकों की संख्या (इंटरसेप्ट सहित)।

ध्यान दें कि पूर्ण मॉडल के लिए वर्गों का अवशिष्ट योग हमेशा छोटा होगा क्योंकि भविष्यवक्ताओं को जोड़ने से हमेशा त्रुटि में कुछ कमी आएगी।

तो एक आंशिक एफ-परीक्षण अनिवार्य रूप से परीक्षण करता है कि क्या आपके द्वारा पूर्ण मॉडल से हटाए गए भविष्यवक्ताओं का समूह वास्तव में उपयोगी है और उन्हें पूर्ण मॉडल में शामिल किया जाना चाहिए।

यह परीक्षण निम्नलिखित शून्य और वैकल्पिक परिकल्पनाओं का उपयोग करता है:

एच ₀ : पूर्ण मॉडल से हटाए गए सभी गुणांक शून्य हैं।

एच _ए : संपूर्ण मॉडल से हटाए गए गुणांकों में से कम से कम एक गैर-शून्य है।

यदि एफ-परीक्षण आंकड़ों के अनुरूप पी-मान एक निश्चित स्तर के महत्व (जैसे 0.05) से नीचे है, तो हम शून्य परिकल्पना को अस्वीकार कर सकते हैं और निष्कर्ष निकाल सकते हैं कि पूर्ण मॉडल से हटाए गए गुणांकों में से कम से कम एक महत्वपूर्ण है।

आंशिक एफ परीक्षण: एक उदाहरण

व्यवहार में, हम आंशिक एफ परीक्षण करने के लिए निम्नलिखित चरणों का उपयोग करते हैं:

1. पूर्ण प्रतिगमन मॉडल को फ़िट करें और RSS _{पूर्ण की} गणना करें।

2. नेस्टेड रिग्रेशन मॉडल को फिट करें और _कम आरएसएस की गणना करें।

3. पूर्ण और संक्षिप्त मॉडल की तुलना करने के लिए एक एनोवा निष्पादित करें, जो मॉडलों की तुलना करने के लिए आवश्यक एफ-परीक्षण आंकड़े तैयार करेगा।

उदाहरण के लिए, निम्नलिखित कोड दिखाता है कि अंतर्निहित एमटीकार्स डेटासेट से डेटा का उपयोग करके आर में निम्नलिखित दो प्रतिगमन मॉडल को कैसे फिट किया जाए:

पूर्ण मॉडल: एमपीजी = β ₀ + β ₁ उपलब्ध + β ₂ कार्ब + β ₃ एचपी + β ₄ सिलेंडर

मॉडल: एमपीजी = β ₀ + β ₁ उपलब्ध + β ₂ कार्ब

 #fit full model
model_full <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars)

#fit reduced model
model_reduced <- lm(mpg ~ disp + carb, data = mtcars)

#perform ANOVA to test for differences in models
anova(model_reduced, model_full)

Analysis of Variance Table

Model 1: mpg ~ available + carb
Model 2: mpg ~ disp + carb + hp + cyl
  Res.Df RSS Df Sum of Sq F Pr(>F)
1 29 254.82                           
2 27 238.71 2 16.113 0.9113 0.414

परिणाम से, हम देख सकते हैं कि एनोवा का एफ परीक्षण आँकड़ा 0.9113 है और संबंधित पी-मान 0.414 है।

चूँकि यह पी-मान 0.05 से कम नहीं है, हम शून्य परिकल्पना को अस्वीकार करने में विफल रहेंगे। इसका मतलब यह है कि हमारे पास यह कहने के लिए पर्याप्त सबूत नहीं हैं कि एचपी या सिलेंडर भविष्यवक्ता चर में से कोई भी सांख्यिकीय रूप से महत्वपूर्ण है।

दूसरे शब्दों में, प्रतिगमन मॉडल में एचपी और सिलेंडर जोड़ने से मॉडल फिट में उल्लेखनीय सुधार नहीं होता है।

लेखक के बारे में

डॉ. बेंजामिन एंडरसन

नमस्ते, मैं बेंजामिन हूं, एक सेवानिवृत्त सांख्यिकी प्रोफेसर जो अब समर्पित Statorials शिक्षक बन गया है। सांख्यिकी के क्षेत्र में व्यापक अनुभव और विशेषज्ञता के साथ, मैं Statorials के माध्यम से छात्रों को सशक्त बनाने के लिए अपना ज्ञान साझा करने के लिए उत्सुक हूं। अधिक जाने

आंशिक एफ परीक्षण: मूल बातें

आंशिक एफ परीक्षण: एक उदाहरण

लेखक के बारे में

डॉ. बेंजामिन एंडरसन

एक टिप्पणी जोड़ने