R में z स्कोर की गणना कैसे करें


आंकड़ों में, एक z-स्कोर हमें बताता है कि एक मान माध्य से कितने मानक विचलन है। हम z-स्कोर की गणना के लिए निम्नलिखित सूत्र का उपयोग करते हैं:

z = (एक्स – μ) / σ

सोना:

  • X एकल कच्चा डेटा मान है
  • μ जनसंख्या माध्य है
  • σ जनसंख्या मानक विचलन है

यह ट्यूटोरियल बताता है कि आर में कच्चे डेटा मानों के लिए ज़ेड-स्कोर की गणना कैसे करें।

उदाहरण 1: एकल वेक्टर के लिए Z-स्कोर ढूँढना

निम्नलिखित कोड दिखाता है कि वेक्टर में प्रत्येक कच्चे डेटा मान के लिए z-स्कोर कैसे खोजा जाए:

 #create vector of data
data <- c(6, 7, 7, 12, 13, 13, 15, 16, 19, 22)

#find z-score for each data value 
z_scores <- (data-mean(data))/sd(data)

#display z-scores
z_scores

[1] -1.3228757 -1.1338934 -1.1338934 -0.1889822 0.0000000 0.0000000
[7] 0.3779645 0.5669467 1.1338934 1.7008401

प्रत्येक z-स्कोर हमें बताता है कि एक व्यक्तिगत मान माध्य से कितने मानक विचलन है। उदाहरण के लिए:

  • “6” का पहला कच्चा डेटा मान औसत से 1.323 मानक विचलन नीचे है।
  • पाँचवाँ कच्चा डेटा मान, “13”, माध्य से 0 मानक विचलन है, अर्थात यह माध्य के बराबर है।
  • “22” का नवीनतम कच्चा डेटा मान औसत से 1.701 मानक विचलन है।

उदाहरण 2: डेटाफ़्रेम में एकल कॉलम के लिए Z-स्कोर खोजें

निम्नलिखित कोड दिखाता है कि डेटाफ़्रेम के एकल कॉलम में प्रत्येक कच्चे डेटा मान के लिए z-स्कोर कैसे खोजा जाए:

 #create dataframe
df <- data.frame(assists = c(4, 4, 6, 7, 9, 13),
                 points = c(24, 29, 13, 15, 19, 22),
                 rebounds = c(5, 5, 7, 8, 14, 15))

#find z-score for each data value in the 'points' column
z_scores <- (df$points-mean(df$points))/sd(df$points)

#display z-scores
z_scores

[1] 0.6191904 1.4635409 -1.2383807 -0.9006405 -0.2251601 0.2814502

प्रत्येक z-स्कोर हमें बताता है कि एक व्यक्तिगत मान माध्य से कितने मानक विचलन है। उदाहरण के लिए:

  • “24” का पहला कच्चा डेटा मान माध्य से 0.619 मानक विचलन ऊपर है।
  • दूसरा कच्चा डेटा मान, “29”, माध्य से 1.464 मानक विचलन ऊपर है।
  • तीसरा कच्चा डेटा मान, “13”, माध्य से 1.238 मानक विचलन नीचे है।

और इसी तरह।

उदाहरण 3: डेटाफ़्रेम में प्रत्येक कॉलम के लिए Z-स्कोर खोजें

निम्नलिखित कोड दिखाता है कि sapply() फ़ंक्शन का उपयोग करके डेटा फ़्रेम के प्रत्येक कॉलम में प्रत्येक कच्चे डेटा मान के लिए z-स्कोर कैसे खोजा जाए।

 #create dataframe
df <- data.frame(assists = c(4, 4, 6, 7, 9, 13),
                 points = c(24, 29, 13, 15, 19, 22),
                 rebounds = c(5, 5, 7, 8, 14, 15))

#find z-scores of each column
sapply(df, function(df) (df-mean(df))/sd(df))

         assists points rebounds
[1,] -0.92315712 0.6191904 -0.9035079
[2,] -0.92315712 1.4635409 -0.9035079
[3,] -0.34011052 -1.2383807 -0.4517540
[4,] -0.04858722 -0.9006405 -0.2258770
[5,] 0.53445939 -0.2251601 1.1293849
[6,] 1.70055260 0.2814502 1.3552619

प्रत्येक व्यक्तिगत मान के लिए z-स्कोर उस कॉलम के सापेक्ष प्रदर्शित होते हैं जिसमें वे स्थित हैं। उदाहरण के लिए:

  • पहले कॉलम में “4” का पहला मान उसके कॉलम के औसत मान से 0.923 मानक विचलन है।
  • दूसरे कॉलम में “24” का पहला मान इसके कॉलम के औसत मान से 0.619 मानक विचलन है।
  • तीसरे कॉलम में “9” का पहला मान इसके कॉलम के औसत मान से 0.904 मानक विचलन कम है।

और इसी तरह।

आप यहां अधिक आर ट्यूटोरियल पा सकते हैं।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *