एसएएस में सहसंबंध मैट्रिक्स कैसे बनाएं (उदाहरण के साथ)
सहसंबंध मैट्रिक्स एक वर्गाकार तालिका है जो डेटा सेट में चर के बीच सहसंबंध गुणांक दिखाती है।
यह डेटा सेट में चर के बीच मौजूद रैखिक संबंधों की ताकत को समझने का एक त्वरित तरीका प्रदान करता है।
आप किसी दिए गए डेटा सेट के लिए सहसंबंध मैट्रिक्स बनाने के लिए एसएएस में PROC CORR कथन का उपयोग कर सकते हैं:
/*create correlation matrix using all numeric variables in my_data*/
proc corr data =my_data;
run ;
डिफ़ॉल्ट रूप से, यह एक मैट्रिक्स बनाएगा जो डेटासेट में सभी संख्यात्मक चर के बीच सहसंबंध गुणांक प्रदर्शित करता है।
सहसंबंध मैट्रिक्स में केवल विशिष्ट चर शामिल करने के लिए, आप VAR कथन का उपयोग कर सकते हैं:
/*create correlation matrix using only var1, var2 and var3 in my_data*/
proc corr data =my_data;
var var1, var2, var3;
run ;
निम्नलिखित उदाहरण दिखाता है कि एसएएस में सहसंबंध मैट्रिक्स कैसे बनाया जाए।
उदाहरण: एसएएस में सहसंबंध मैट्रिक्स बनाना
मान लीजिए कि हमारे पास एसएएस में निम्नलिखित डेटासेट है जिसमें विभिन्न बास्केटबॉल खिलाड़ियों के बारे में जानकारी है:
/*create dataset*/
data my_data;
input team $ assists rebounds points;
datalines ;
A 4 12 22
A 5 14 24
A 5 13 26
A 6 7 26
B 7 8 29
B 8 8 32
B 8 9 20
B 10 13 14
;
run ;
/*view dataset*/
proc print data =my_data;
हम एक सहसंबंध मैट्रिक्स बनाने के लिए PROC CORR कथन का उपयोग कर सकते हैं जिसमें डिफ़ॉल्ट रूप से डेटासेट में प्रत्येक संख्यात्मक चर शामिल होता है:
/*create correlation matrix using all numeric variables in my_data*/
proc corr data =my_data;
run ;
आउटपुट सहसंबंध मैट्रिक्स के साथ पहली तालिका में संख्यात्मक चर के सारांश आंकड़े प्रदर्शित करता है।
ध्यान दें कि “टीम” चर को सहसंबंध मैट्रिक्स में शामिल नहीं किया गया था क्योंकि यह एक संख्यात्मक चर नहीं था।
यहां सहसंबंध मैट्रिक्स मानों की व्याख्या करने का तरीका बताया गया है:
(1) सहायता और रिबाउंड के बीच पियर्सन सहसंबंध गुणांक (आर) -0.24486 है। संगत पी-मान 0.5589 है।
चूँकि r शून्य से कम है, यह हमें बताता है कि इन दो चरों के बीच एक नकारात्मक रैखिक संबंध है। हालाँकि, पी-मान 0.05 से कम नहीं है, इसलिए यह सहसंबंध सांख्यिकीय रूप से महत्वपूर्ण नहीं है।
(2) सहायता और अंक के बीच पियर्सन सहसंबंध गुणांक (आर) -0.32957 है। संगत पी-मान 0.4253 है।
इन दोनों चरों के बीच एक नकारात्मक रैखिक संबंध है लेकिन यह सांख्यिकीय रूप से महत्वपूर्ण नहीं है।
(3) रिबाउंड और पॉइंट के बीच पियर्सन सहसंबंध गुणांक (आर) -0.52209 है। संगत पी-मान 0.1844 है।
इन दोनों चरों के बीच एक नकारात्मक रैखिक संबंध है लेकिन यह सांख्यिकीय रूप से महत्वपूर्ण नहीं है।
ध्यान दें कि हम सहसंबंध मैट्रिक्स में केवल विशिष्ट संख्यात्मक चर शामिल करने के लिए VAR कथन का भी उपयोग कर सकते हैं:
/*create correlation matrix using only assists and rebounds variables*/
proc corr data =my_data;
var assists rebounds;
run ;
ध्यान दें कि इस सहसंबंध मैट्रिक्स में केवल सहायता और रिबाउंड चर शामिल थे।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि एसएएस में अन्य सामान्य कार्य कैसे करें:
एसएएस में स्कैटरप्लॉट मैट्रिक्स कैसे बनाएं
एसएएस में पिवोटटेबल्स कैसे बनाएं
एसएएस में वेरिएंस इन्फ्लेशन फैक्टर (वीआईएफ) की गणना कैसे करें