आर में व्हाइट का परीक्षण कैसे करें (उदाहरण के साथ)
व्हाइट के परीक्षण का उपयोग यह निर्धारित करने के लिए किया जाता है कि प्रतिगमन मॉडल में विषमलैंगिकता मौजूद है या नहीं।
विषमलैंगिकता एक प्रतिगमन मॉडल में प्रतिक्रिया चर के विभिन्न स्तरों पर अवशेषों के असमान फैलाव को संदर्भित करती है, जो रैखिक प्रतिगमन की प्रमुख धारणाओं में से एक का उल्लंघन करती है कि प्रतिक्रिया चर के प्रत्येक स्तर पर अवशेष समान रूप से बिखरे हुए हैं।
यह ट्यूटोरियल बताता है कि किसी दिए गए प्रतिगमन मॉडल में विषमलैंगिकता एक समस्या है या नहीं, यह निर्धारित करने के लिए आर में व्हाइट टेस्ट कैसे करें।
उदाहरण: आर में श्वेत परीक्षण
इस उदाहरण में, हम एमटीकार्स बिल्ट-इन आर डेटासेट का उपयोग करके एक मल्टीपल लीनियर रिग्रेशन मॉडल फिट करेंगे।
एक बार जब हम मॉडल को फिट कर लेते हैं, तो हम यह निर्धारित करने के लिए कि क्या विषमलैंगिकता मौजूद है, श्वेत परीक्षण करने के लिए एलएमटेस्ट लाइब्रेरी से बीपीटेस्ट फ़ंक्शन का उपयोग करेंगे।
चरण 1: एक प्रतिगमन मॉडल फिट करें।
सबसे पहले, हम प्रतिक्रिया चर के रूप में mpg और दो व्याख्यात्मक चर के रूप में disp और hp का उपयोग करके एक प्रतिगमन मॉडल फिट करेंगे।
#load the dataset data(mtcars) #fit a regression model model <- lm(mpg~disp+hp, data=mtcars) #view model summary summary(model) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.127 on 29 degrees of freedom Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09
चरण 2: व्हाइट का परीक्षण करें।
इसके बाद, हम यह निर्धारित करने के लिए व्हाइट का परीक्षण करने के लिए निम्नलिखित वाक्यविन्यास का उपयोग करेंगे कि विषमलैंगिकता मौजूद है या नहीं:
#load lmtest library library(lmtest) #perform White's test bptest(model, ~ disp*hp + I(disp^2) + I(hp^2), data = mtcars) studentized Breusch-Pagan test data: model BP = 7.0766, df = 5, p-value = 0.215
यहां परिणाम की व्याख्या करने का तरीका बताया गया है:
- परीक्षण आँकड़ा X2 = 7.0766 है।
- स्वतंत्रता की कोटियाँ 5 हैं।
- संगत पी-मान 0.215 है।
श्वेत परीक्षण निम्नलिखित शून्य और वैकल्पिक परिकल्पनाओं का उपयोग करता है:
- शून्य (एच 0 ) : समरूपता विद्यमान है।
- वैकल्पिक ( एचए ): विषमलैंगिकता मौजूद है।
चूँकि पी-मान 0.05 से कम नहीं है, हम शून्य परिकल्पना को अस्वीकार करने में विफल रहते हैं। हमारे पास यह दावा करने के लिए पर्याप्त सबूत नहीं हैं कि प्रतिगमन मॉडल में विषमलैंगिकता मौजूद है।
आगे क्या करना है
यदि आप व्हाइट के परीक्षण की शून्य परिकल्पना को अस्वीकार करने में विफल रहते हैं, तो विषमलैंगिकता मौजूद नहीं है और आप मूल प्रतिगमन के परिणाम की व्याख्या करने के लिए आगे बढ़ सकते हैं।
हालाँकि, यदि आप शून्य परिकल्पना को अस्वीकार करते हैं, तो इसका मतलब है कि डेटा में विषमलैंगिकता मौजूद है। इस मामले में, प्रतिगमन आउटपुट तालिका में प्रदर्शित मानक त्रुटियां अविश्वसनीय हो सकती हैं।
इस समस्या को हल करने के कई सामान्य तरीके हैं, जिनमें शामिल हैं:
1. प्रतिक्रिया चर को रूपांतरित करें।
आप प्रतिक्रिया चर पर परिवर्तन करने का प्रयास कर सकते हैं, उदाहरण के लिए प्रतिक्रिया चर का लॉग, वर्गमूल या घनमूल लेना। आम तौर पर, इससे विषमलैंगिकता गायब हो सकती है।
2. भारित प्रतिगमन का प्रयोग करें.
भारित प्रतिगमन प्रत्येक डेटा बिंदु को उसके फिट मूल्य के भिन्नता के आधार पर एक भार प्रदान करता है। अनिवार्य रूप से, यह उन डेटा बिंदुओं को कम महत्व देता है जिनमें अधिक भिन्नताएं होती हैं, जिससे उनके अवशिष्ट वर्ग कम हो जाते हैं। जब उचित वजन का उपयोग किया जाता है, तो यह विषमलैंगिकता की समस्या को समाप्त कर सकता है।