आर में व्हाइट का परीक्षण कैसे करें (उदाहरण के साथ)

द्वारा डॉ. बेंजामिन एंडरसन जुलाई 27, 2023 मार्गदर्शक शून्य टिप्पणियां

व्हाइट के परीक्षण का उपयोग यह निर्धारित करने के लिए किया जाता है कि प्रतिगमन मॉडल में विषमलैंगिकता मौजूद है या नहीं।

विषमलैंगिकता एक प्रतिगमन मॉडल में प्रतिक्रिया चर के विभिन्न स्तरों पर अवशेषों के असमान फैलाव को संदर्भित करती है, जो रैखिक प्रतिगमन की प्रमुख धारणाओं में से एक का उल्लंघन करती है कि प्रतिक्रिया चर के प्रत्येक स्तर पर अवशेष समान रूप से बिखरे हुए हैं।

यह ट्यूटोरियल बताता है कि किसी दिए गए प्रतिगमन मॉडल में विषमलैंगिकता एक समस्या है या नहीं, यह निर्धारित करने के लिए आर में व्हाइट टेस्ट कैसे करें।

उदाहरण: आर में श्वेत परीक्षण

इस उदाहरण में, हम एमटीकार्स बिल्ट-इन आर डेटासेट का उपयोग करके एक मल्टीपल लीनियर रिग्रेशन मॉडल फिट करेंगे।

एक बार जब हम मॉडल को फिट कर लेते हैं, तो हम यह निर्धारित करने के लिए कि क्या विषमलैंगिकता मौजूद है, श्वेत परीक्षण करने के लिए एलएमटेस्ट लाइब्रेरी से बीपीटेस्ट फ़ंक्शन का उपयोग करेंगे।

चरण 1: एक प्रतिगमन मॉडल फिट करें।

सबसे पहले, हम प्रतिक्रिया चर के रूप में mpg और दो व्याख्यात्मक चर के रूप में disp और hp का उपयोग करके एक प्रतिगमन मॉडल फिट करेंगे।

 #load the dataset
data(mtcars)

#fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

चरण 2: व्हाइट का परीक्षण करें।

इसके बाद, हम यह निर्धारित करने के लिए व्हाइट का परीक्षण करने के लिए निम्नलिखित वाक्यविन्यास का उपयोग करेंगे कि विषमलैंगिकता मौजूद है या नहीं:

 #load lmtest library
library(lmtest)

#perform White's test
bptest(model, ~ disp*hp + I(disp^2) + I(hp^2), data = mtcars)

	studentized Breusch-Pagan test

data: model
BP = 7.0766, df = 5, p-value = 0.215

यहां परिणाम की व्याख्या करने का तरीका बताया गया है:

परीक्षण आँकड़ा ^X2 = 7.0766 है।
स्वतंत्रता की कोटियाँ 5 हैं।
संगत पी-मान 0.215 है।

श्वेत परीक्षण निम्नलिखित शून्य और वैकल्पिक परिकल्पनाओं का उपयोग करता है:

शून्य (एच ₀ ) : समरूपता विद्यमान है।
वैकल्पिक ( _एचए ): विषमलैंगिकता मौजूद है।

चूँकि पी-मान 0.05 से कम नहीं है, हम शून्य परिकल्पना को अस्वीकार करने में विफल रहते हैं। हमारे पास यह दावा करने के लिए पर्याप्त सबूत नहीं हैं कि प्रतिगमन मॉडल में विषमलैंगिकता मौजूद है।

आगे क्या करना है

यदि आप व्हाइट के परीक्षण की शून्य परिकल्पना को अस्वीकार करने में विफल रहते हैं, तो विषमलैंगिकता मौजूद नहीं है और आप मूल प्रतिगमन के परिणाम की व्याख्या करने के लिए आगे बढ़ सकते हैं।

हालाँकि, यदि आप शून्य परिकल्पना को अस्वीकार करते हैं, तो इसका मतलब है कि डेटा में विषमलैंगिकता मौजूद है। इस मामले में, प्रतिगमन आउटपुट तालिका में प्रदर्शित मानक त्रुटियां अविश्वसनीय हो सकती हैं।

इस समस्या को हल करने के कई सामान्य तरीके हैं, जिनमें शामिल हैं:

1. प्रतिक्रिया चर को रूपांतरित करें।

आप प्रतिक्रिया चर पर परिवर्तन करने का प्रयास कर सकते हैं, उदाहरण के लिए प्रतिक्रिया चर का लॉग, वर्गमूल या घनमूल लेना। आम तौर पर, इससे विषमलैंगिकता गायब हो सकती है।

2. भारित प्रतिगमन का प्रयोग करें.

भारित प्रतिगमन प्रत्येक डेटा बिंदु को उसके फिट मूल्य के भिन्नता के आधार पर एक भार प्रदान करता है। अनिवार्य रूप से, यह उन डेटा बिंदुओं को कम महत्व देता है जिनमें अधिक भिन्नताएं होती हैं, जिससे उनके अवशिष्ट वर्ग कम हो जाते हैं। जब उचित वजन का उपयोग किया जाता है, तो यह विषमलैंगिकता की समस्या को समाप्त कर सकता है।

लेखक के बारे में

डॉ. बेंजामिन एंडरसन

नमस्ते, मैं बेंजामिन हूं, एक सेवानिवृत्त सांख्यिकी प्रोफेसर जो अब समर्पित Statorials शिक्षक बन गया है। सांख्यिकी के क्षेत्र में व्यापक अनुभव और विशेषज्ञता के साथ, मैं Statorials के माध्यम से छात्रों को सशक्त बनाने के लिए अपना ज्ञान साझा करने के लिए उत्सुक हूं। अधिक जाने

उदाहरण: आर में श्वेत परीक्षण

आगे क्या करना है

लेखक के बारे में

डॉ. बेंजामिन एंडरसन

एक टिप्पणी जोड़ने