Dplyr का उपयोग करके मानक विचलन की गणना कैसे करें (उदाहरण के साथ)


आप dplyr में डेटा फ़्रेम में मानों के मानक विचलन की गणना करने के लिए निम्नलिखित विधियों का उपयोग कर सकते हैं:

विधि 1: एक चर के मानक विचलन की गणना करें

 library (dplyr)

df %>%
  summarise(sd_var1 = sd(var1, na. rm = TRUE ))

विधि 2: एकाधिक चरों के मानक विचलन की गणना करें

 library (dplyr)

df %>%
  summarize(sd_var1 = sd(var1, na. rm = TRUE ),
            sd_var2 = sd(var2, na. rm = TRUE ))

विधि 3: किसी अन्य चर द्वारा समूहीकृत कई चरों के मानक विचलन की गणना करें

 library (dplyr)

df %>%
  group_by(var3) %>%
  summarize(sd_var1 = sd(var1, na. rm = TRUE ),
            sd_var2 = sd(var2, na. rm = TRUE ))

यह ट्यूटोरियल बताता है कि आर में निम्नलिखित डेटा फ्रेम के साथ अभ्यास में प्रत्येक विधि का उपयोग कैसे करें:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(12, 15, 18, 22, 14, 17, 29, 35),
                 assists=c(4, 4, 3, 6, 7, 8, 3, 10))

#view data frame
df

  team points assists
1 to 12 4
2 to 15 4
3 To 18 3
4 to 22 6
5 B 14 7
6 B 17 8
7 B 29 3
8 B 35 10

उदाहरण 1: एक चर के मानक विचलन की गणना करें

निम्नलिखित कोड दिखाता है कि अंक चर के मानक विचलन की गणना कैसे करें:

 library (dplyr)

#calculate standard deviation of points variable
df %>%
  summarise(sd_points = sd(points, na. rm = TRUE ))

  sd_points
1 7.995534

परिणाम से, हम देख सकते हैं कि पॉइंट वेरिएबल के मानों का मानक विचलन 7.995534 है।

उदाहरण 2: कई चरों के मानक विचलन की गणना करें

निम्नलिखित कोड दिखाता है कि अंक और सहायक चर के मानक विचलन की गणना कैसे करें:

 library (dplyr)

#calculate standard deviation of points and assists variables
df %>%
  summarise(sd_points = sd(points, na. rm = TRUE ),
            sd_assists = sd(assists, na. rm = TRUE ))

  sd_points sd_assists
1 7.995534 2.559994

आउटपुट अंक और सहायक चर के लिए मानक विचलन प्रदर्शित करता है।

उदाहरण 3: किसी अन्य चर द्वारा समूहीकृत कई चरों के मानक विचलन की गणना करें

निम्नलिखित कोड दिखाता है कि अंक और सहायक चर के मानक विचलन की गणना कैसे करें:

 library (dplyr)

#calculate standard deviation of points and assists variables
df %>%
  group_by(team) %>%
  summarise(sd_points = sd(points, na. rm = TRUE ),
            sd_assists = sd(assists, na. rm = TRUE ))

# A tibble: 2 x 3
  team sd_points sd_assists
             
1 A 4.27 1.26
2B 9.91 2.94

परिणाम टीम ए और टीम बी के लिए अंकों और सहायता चर के लिए मानक विचलन प्रदर्शित करता है।

ध्यान दें : यदि आप कई वेरिएबल्स के आधार पर समूह बनाना चाहते हैं तो आप Group_by() फ़ंक्शन में कई वेरिएबल्स की एक सूची शामिल कर सकते हैं।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य कार्य कैसे करें:

Dplyr का उपयोग करके अद्वितीय मानों को कैसे फ़िल्टर करें
Dplyr का उपयोग करके अनेक स्थितियों के आधार पर फ़िल्टर कैसे करें
आर में कॉलम में घटनाओं की संख्या की गणना कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *