R में z स्कोर की गणना कैसे करें
आंकड़ों में, एक z-स्कोर हमें बताता है कि एक मान माध्य से कितने मानक विचलन है। हम z-स्कोर की गणना के लिए निम्नलिखित सूत्र का उपयोग करते हैं:
z = (एक्स – μ) / σ
सोना:
- X एकल कच्चा डेटा मान है
- μ जनसंख्या माध्य है
- σ जनसंख्या मानक विचलन है
यह ट्यूटोरियल बताता है कि आर में कच्चे डेटा मानों के लिए ज़ेड-स्कोर की गणना कैसे करें।
उदाहरण 1: एकल वेक्टर के लिए Z-स्कोर ढूँढना
निम्नलिखित कोड दिखाता है कि वेक्टर में प्रत्येक कच्चे डेटा मान के लिए z-स्कोर कैसे खोजा जाए:
#create vector of data data <- c(6, 7, 7, 12, 13, 13, 15, 16, 19, 22) #find z-score for each data value z_scores <- (data-mean(data))/sd(data) #display z-scores z_scores [1] -1.3228757 -1.1338934 -1.1338934 -0.1889822 0.0000000 0.0000000 [7] 0.3779645 0.5669467 1.1338934 1.7008401
प्रत्येक z-स्कोर हमें बताता है कि एक व्यक्तिगत मान माध्य से कितने मानक विचलन है। उदाहरण के लिए:
- “6” का पहला कच्चा डेटा मान औसत से 1.323 मानक विचलन नीचे है।
- पाँचवाँ कच्चा डेटा मान, “13”, माध्य से 0 मानक विचलन है, अर्थात यह माध्य के बराबर है।
- “22” का नवीनतम कच्चा डेटा मान औसत से 1.701 मानक विचलन है।
उदाहरण 2: डेटाफ़्रेम में एकल कॉलम के लिए Z-स्कोर खोजें
निम्नलिखित कोड दिखाता है कि डेटाफ़्रेम के एकल कॉलम में प्रत्येक कच्चे डेटा मान के लिए z-स्कोर कैसे खोजा जाए:
#create dataframe df <- data.frame(assists = c(4, 4, 6, 7, 9, 13), points = c(24, 29, 13, 15, 19, 22), rebounds = c(5, 5, 7, 8, 14, 15)) #find z-score for each data value in the 'points' column z_scores <- (df$points-mean(df$points))/sd(df$points) #display z-scores z_scores [1] 0.6191904 1.4635409 -1.2383807 -0.9006405 -0.2251601 0.2814502
प्रत्येक z-स्कोर हमें बताता है कि एक व्यक्तिगत मान माध्य से कितने मानक विचलन है। उदाहरण के लिए:
- “24” का पहला कच्चा डेटा मान माध्य से 0.619 मानक विचलन ऊपर है।
- दूसरा कच्चा डेटा मान, “29”, माध्य से 1.464 मानक विचलन ऊपर है।
- तीसरा कच्चा डेटा मान, “13”, माध्य से 1.238 मानक विचलन नीचे है।
और इसी तरह।
उदाहरण 3: डेटाफ़्रेम में प्रत्येक कॉलम के लिए Z-स्कोर खोजें
निम्नलिखित कोड दिखाता है कि sapply() फ़ंक्शन का उपयोग करके डेटा फ़्रेम के प्रत्येक कॉलम में प्रत्येक कच्चे डेटा मान के लिए z-स्कोर कैसे खोजा जाए।
#create dataframe df <- data.frame(assists = c(4, 4, 6, 7, 9, 13), points = c(24, 29, 13, 15, 19, 22), rebounds = c(5, 5, 7, 8, 14, 15)) #find z-scores of each column sapply(df, function(df) (df-mean(df))/sd(df)) assists points rebounds [1,] -0.92315712 0.6191904 -0.9035079 [2,] -0.92315712 1.4635409 -0.9035079 [3,] -0.34011052 -1.2383807 -0.4517540 [4,] -0.04858722 -0.9006405 -0.2258770 [5,] 0.53445939 -0.2251601 1.1293849 [6,] 1.70055260 0.2814502 1.3552619
प्रत्येक व्यक्तिगत मान के लिए z-स्कोर उस कॉलम के सापेक्ष प्रदर्शित होते हैं जिसमें वे स्थित हैं। उदाहरण के लिए:
- पहले कॉलम में “4” का पहला मान उसके कॉलम के औसत मान से 0.923 मानक विचलन है।
- दूसरे कॉलम में “24” का पहला मान इसके कॉलम के औसत मान से 0.619 मानक विचलन है।
- तीसरे कॉलम में “9” का पहला मान इसके कॉलम के औसत मान से 0.904 मानक विचलन कम है।
और इसी तरह।
आप यहां अधिक आर ट्यूटोरियल पा सकते हैं।