Dplyr का उपयोग करके मानक विचलन की गणना कैसे करें (उदाहरण के साथ)
आप dplyr में डेटा फ़्रेम में मानों के मानक विचलन की गणना करने के लिए निम्नलिखित विधियों का उपयोग कर सकते हैं:
विधि 1: एक चर के मानक विचलन की गणना करें
library (dplyr) df %>% summarise(sd_var1 = sd(var1, na. rm = TRUE ))
विधि 2: एकाधिक चरों के मानक विचलन की गणना करें
library (dplyr) df %>% summarize(sd_var1 = sd(var1, na. rm = TRUE ), sd_var2 = sd(var2, na. rm = TRUE ))
विधि 3: किसी अन्य चर द्वारा समूहीकृत कई चरों के मानक विचलन की गणना करें
library (dplyr) df %>% group_by(var3) %>% summarize(sd_var1 = sd(var1, na. rm = TRUE ), sd_var2 = sd(var2, na. rm = TRUE ))
यह ट्यूटोरियल बताता है कि आर में निम्नलिखित डेटा फ्रेम के साथ अभ्यास में प्रत्येक विधि का उपयोग कैसे करें:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
points=c(12, 15, 18, 22, 14, 17, 29, 35),
assists=c(4, 4, 3, 6, 7, 8, 3, 10))
#view data frame
df
team points assists
1 to 12 4
2 to 15 4
3 To 18 3
4 to 22 6
5 B 14 7
6 B 17 8
7 B 29 3
8 B 35 10
उदाहरण 1: एक चर के मानक विचलन की गणना करें
निम्नलिखित कोड दिखाता है कि अंक चर के मानक विचलन की गणना कैसे करें:
library (dplyr) #calculate standard deviation of points variable df %>% summarise(sd_points = sd(points, na. rm = TRUE )) sd_points 1 7.995534
परिणाम से, हम देख सकते हैं कि पॉइंट वेरिएबल के मानों का मानक विचलन 7.995534 है।
उदाहरण 2: कई चरों के मानक विचलन की गणना करें
निम्नलिखित कोड दिखाता है कि अंक और सहायक चर के मानक विचलन की गणना कैसे करें:
library (dplyr) #calculate standard deviation of points and assists variables df %>% summarise(sd_points = sd(points, na. rm = TRUE ), sd_assists = sd(assists, na. rm = TRUE )) sd_points sd_assists 1 7.995534 2.559994
आउटपुट अंक और सहायक चर के लिए मानक विचलन प्रदर्शित करता है।
उदाहरण 3: किसी अन्य चर द्वारा समूहीकृत कई चरों के मानक विचलन की गणना करें
निम्नलिखित कोड दिखाता है कि अंक और सहायक चर के मानक विचलन की गणना कैसे करें:
library (dplyr) #calculate standard deviation of points and assists variables df %>% group_by(team) %>% summarise(sd_points = sd(points, na. rm = TRUE ), sd_assists = sd(assists, na. rm = TRUE )) # A tibble: 2 x 3 team sd_points sd_assists 1 A 4.27 1.26 2B 9.91 2.94
परिणाम टीम ए और टीम बी के लिए अंकों और सहायता चर के लिए मानक विचलन प्रदर्शित करता है।
ध्यान दें : यदि आप कई वेरिएबल्स के आधार पर समूह बनाना चाहते हैं तो आप Group_by() फ़ंक्शन में कई वेरिएबल्स की एक सूची शामिल कर सकते हैं।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य कार्य कैसे करें:
Dplyr का उपयोग करके अद्वितीय मानों को कैसे फ़िल्टर करें
Dplyr का उपयोग करके अनेक स्थितियों के आधार पर फ़िल्टर कैसे करें
आर में कॉलम में घटनाओं की संख्या की गणना कैसे करें