एसएएस में डेटा को सामान्य कैसे करें
डेटा मानों के एक सेट को “सामान्यीकृत” करने का अर्थ है मानों को ऐसे स्केल करना कि सभी मानों का माध्य 0 हो और मानक विचलन 1 हो।
यह ट्यूटोरियल बताता है कि एसएएस में डेटा को कैसे सामान्य किया जाए।
उदाहरण: एसएएस में डेटा को सामान्य कैसे करें
मान लीजिए हमारे पास निम्नलिखित डेटा सेट है:
एसएएस में डेटा मानों के इस सेट को सामान्य करने के लिए निम्नलिखित चरणों को पूरा करें।
चरण 1: डेटासेट बनाएं
सबसे पहले, आइए एसएएस में डेटासेट बनाने के लिए निम्नलिखित कोड का उपयोग करें:
/*create dataset*/ data original_data; input values; datalines ; 12 14 15 15 16 17 18 20 24 25 26 29 32 34 37 ; run ; /*view mean and standard deviation of dataset*/ proc means data =original_data Mean StdDev ndec= 3 ; var values; run ;
परिणाम से, हम देख सकते हैं कि डेटासेट का माध्य 22.267 है और मानक विचलन 7.968 है।
चरण 2: डेटासेट को सामान्य करें
इसके बाद, हम डेटासेट को सामान्य करने के लिए proc stdize का उपयोग करेंगे:
/*normalize the dataset*/
proc stdize data =original_data out =normalized_data;
var values;
run ;
/*print normalized dataset*/
proc print data =normalized_data;
/*view mean and standard deviation of normalized dataset*/
proc means data =normalized_data Mean StdDev ndec= 2 ;
var values;
run ;
परिणाम से, हम देख सकते हैं कि सामान्यीकृत डेटासेट का माध्य 0 है और मानक विचलन 1 है।
चरण 3: सामान्यीकृत डेटा की व्याख्या करें
एसएएस ने डेटा मानों को सामान्य करने के लिए निम्नलिखित सूत्र का उपयोग किया:
सामान्यीकृत मान = (x – x )/s
सोना:
- x = डेटा मान
- x = डेटासेट का माध्य
- s = डेटासेट का मानक विचलन
प्रत्येक सामान्यीकृत मान हमें मूल डेटा मान और माध्य के बीच मानक विचलन की संख्या बताता है।
उदाहरण के लिए, हमारे मूल डेटासेट में डेटा बिंदु “12” पर विचार करें। मूल नमूना माध्य 22.267 था और मूल नमूना मानक विचलन 7.968 था।
“12” का सामान्यीकृत मान -1.288 निकला, जिसकी गणना इस प्रकार की गई है:
सामान्यीकृत मान = (x – x ) / s = (12 – 22.267) / 7.968 = -1.288
यह हमें बताता है कि मान “12” मूल डेटासेट के माध्य से 1.288 मानक विचलन कम है।
डेटासेट में प्रत्येक सामान्यीकृत मान हमें यह समझने में मदद कर सकता है कि कोई विशेष डेटा मान माध्य से कितना करीब या दूर है।
एक छोटा सामान्यीकृत मान इंगित करता है कि एक मान माध्य के करीब है जबकि एक बड़ा सामान्यीकृत मान इंगित करता है कि एक मान माध्य से बहुत दूर है।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि एसएएस में अन्य सामान्य कार्य कैसे करें:
एसएएस में प्रक्रिया सारांश का उपयोग कैसे करें
एसएएस में सहसंबंध की गणना कैसे करें
एसएएस में फ़्रीक्वेंसी टेबल कैसे बनाएं