एसएएस में व्हाइट का परीक्षण कैसे करें


व्हाइट के परीक्षण का उपयोग यह निर्धारित करने के लिए किया जाता है कि प्रतिगमन मॉडल में विषमलैंगिकता मौजूद है या नहीं।

विषमलैंगिकता एक प्रतिगमन मॉडल में प्रतिक्रिया चर के विभिन्न स्तरों पर अवशेषों के असमान फैलाव को संदर्भित करती है, जो रैखिक प्रतिगमन की प्रमुख धारणाओं में से एक का उल्लंघन करती है कि प्रतिक्रिया चर के प्रत्येक स्तर पर अवशेष समान रूप से बिखरे हुए हैं।

यह ट्यूटोरियल बताता है कि एसएएस में श्वेत परीक्षण कैसे किया जाए ताकि यह निर्धारित किया जा सके कि किसी दिए गए प्रतिगमन मॉडल में हेटेरोस्केडैस्टिसिटी एक समस्या है या नहीं।

उदाहरण: एसएएस में श्वेत परीक्षण

मान लीजिए कि हम एक एकाधिक रेखीय प्रतिगमन मॉडल फिट करना चाहते हैं जो छात्रों के अंतिम परीक्षा ग्रेड की भविष्यवाणी करने के लिए अध्ययन में बिताए गए घंटों की संख्या और अभ्यास परीक्षाओं की संख्या का उपयोग करता है:

परीक्षा स्कोर = β 0 + β 1 (घंटे) + β 2 (प्रारंभिक परीक्षा)

सबसे पहले, हम 20 छात्रों के लिए इस जानकारी वाला डेटासेट बनाने के लिए निम्नलिखित कोड का उपयोग करेंगे:

 /*create dataset*/
data exam_data;
    input hours prep_exams score;
    datalines ;
1 1 76
2 3 78
2 3 85
4 5 88
2 2 72
1 2 69
5 1 94
4 1 94
2 0 88
4 3 92
4 4 90
3 3 75
6 2 90
5 4 90
3 4 82
4 4 85
6 5 90
2 1 83
1 0 62
2 1 76
;
run ;

/*view dataset*/
proc print data =exam_data; 

इसके बाद, हम इस एकाधिक रैखिक प्रतिगमन मॉडल को फिट करने के लिए proc reg का उपयोग करेंगे और साथ ही विषमलैंगिकता के लिए व्हाइट का परीक्षण करने के लिए विशिष्ट विकल्प का उपयोग करेंगे:

 /*fit regression model and perform White's test*/
proc reg data =exam_data;
    model score = hours prep_exams / spec ;
run ;
quit ; 

एसएएस में श्वेत परीक्षण

अंतिम परिणाम तालिका व्हाइट के परीक्षण के परिणाम दिखाती है।

इस तालिका से, हम देख सकते हैं कि ची-स्क्वायर परीक्षण आँकड़ा 3.54 है और संबंधित पी-मान 0.6175 है।

श्वेत परीक्षण निम्नलिखित शून्य और वैकल्पिक परिकल्पनाओं का उपयोग करता है:

  • शून्य (H 0 ) : हेटेरोस्केडैस्टिसिटी मौजूद नहीं है।
  • वैकल्पिक ( एचए ): विषमलैंगिकता मौजूद है।

चूँकि पी-मान 0.05 से कम नहीं है, हम शून्य परिकल्पना को अस्वीकार करने में विफल रहते हैं।

इसका मतलब यह है कि हमारे पास यह दावा करने के लिए पर्याप्त सबूत नहीं हैं कि प्रतिगमन मॉडल में विषमलैंगिकता मौजूद है।

इसलिए प्रतिगमन सारांश तालिका में गुणांक अनुमानों की मानक त्रुटियों की सुरक्षित रूप से व्याख्या करना संभव है।

आगे क्या करना है

यदि आप व्हाइट के परीक्षण की शून्य परिकल्पना को अस्वीकार करने में विफल रहते हैं, तो विषमलैंगिकता मौजूद नहीं है और आप मूल प्रतिगमन के परिणाम की व्याख्या करने के लिए आगे बढ़ सकते हैं।

हालाँकि, यदि आप शून्य परिकल्पना को अस्वीकार करते हैं, तो इसका मतलब है कि डेटा में विषमलैंगिकता मौजूद है। इस मामले में, प्रतिगमन आउटपुट तालिका में प्रदर्शित मानक त्रुटियां अविश्वसनीय हो सकती हैं।

इस समस्या को हल करने के कई सामान्य तरीके हैं, जिनमें शामिल हैं:

1. प्रतिक्रिया चर को रूपांतरित करें। आप प्रतिक्रिया चर पर परिवर्तन करने का प्रयास कर सकते हैं।

उदाहरण के लिए, आप मूल प्रतिक्रिया चर के बजाय लॉग प्रतिक्रिया चर का उपयोग कर सकते हैं।

आम तौर पर , प्रतिक्रिया चर का लॉग लेना विषमलैंगिकता को गायब करने का एक प्रभावी तरीका है।

एक अन्य सामान्य परिवर्तन प्रतिक्रिया चर के वर्गमूल का उपयोग करना है।

2. भारित प्रतिगमन का प्रयोग करें. इस प्रकार का प्रतिगमन प्रत्येक डेटा बिंदु को उसके फिट किए गए मान के भिन्नता के आधार पर एक भार प्रदान करता है।

यह उन डेटा बिंदुओं को छोटा भार देता है जिनमें अधिक भिन्नताएं होती हैं, जिससे उनके अवशिष्ट वर्ग कम हो जाते हैं।

जब उचित वजन का उपयोग किया जाता है, तो यह विषमलैंगिकता की समस्या को समाप्त कर सकता है।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *