Dplyr का उपयोग करके प्रत्येक पंक्ति में फ़ंक्शन कैसे लागू करें
आप dplyr फ़ंक्शंस का उपयोग करके R में डेटा फ़्रेम की प्रत्येक पंक्ति में फ़ंक्शन लागू करने के लिए निम्नलिखित मूल सिंटैक्स का उपयोग कर सकते हैं:
df %>% rowwise() %>% mutate(mean_value = mean(c(col1, col2, col3), na. rm = TRUE ))
यह विशेष उदाहरण डेटा फ़्रेम में प्रत्येक पंक्ति के लिए col1 , col2 , और col3 के औसत मान की गणना करता है, लेकिन आप मीन() फ़ंक्शन को किसी भी फ़ंक्शन से बदल सकते हैं जिसके लिए आप एक अलग मीट्रिक की गणना करना चाहते हैं।
निम्नलिखित उदाहरण दिखाते हैं कि निम्नलिखित डेटा फ़्रेम के साथ अभ्यास में इस सिंटैक्स का उपयोग कैसे किया जाए जिसमें विभिन्न खेलों में विभिन्न बास्केटबॉल खिलाड़ियों द्वारा बनाए गए अंकों के बारे में जानकारी शामिल है:
#create data frame df <- data. frame (game1=c(22, 25, 29, 13, 22, 30), game2=c(12, 10, 6, 6, 8, 11), game3=c(NA, 15, 15, 18, 22, 13)) #view data frame df game1 game2 game3 1 22 12 NA 2 25 10 15 3 29 6 15 4 13 6 18 5 22 8 22 6 30 11 13
उदाहरण 1: प्रत्येक पंक्ति में विशिष्ट स्तंभों का औसत
निम्नलिखित कोड दिखाता है कि डेटा फ्रेम में प्रत्येक पंक्ति के लिए गेम1 और गेम3 कॉलम के औसत मूल्य की गणना कैसे करें:
library (dplyr)
#calculate mean of game1 and game3
df %>%
rowwise() %>%
mutate(mean_points = mean(c(game1, game3), na. rm = TRUE ))
# A tibble: 6 x 4
#Rowwise:
game1 game2 game3 mean_points
1 22 12 NA 22
2 25 10 15 20
3 29 6 15 22
4 13 6 18 15.5
5 22 8 22 22
6 30 11 13 21.5
परिणाम से हम देख सकते हैं:
- पहली पंक्ति में गेम1 और गेम3 का औसत मान 22 है।
- दूसरी पंक्ति में गेम1 और गेम3 का औसत मान 20 है।
- तीसरी पंक्ति में गेम1 और गेम3 का औसत मान 22 है।
और इसी तरह।
उदाहरण 2: प्रत्येक पंक्ति में विशिष्ट स्तंभों की अधिकतम संख्या
निम्नलिखित कोड दिखाता है कि डेटा फ्रेम में प्रत्येक पंक्ति के लिए गेम2 और गेम3 कॉलम के अधिकतम मूल्य की गणना कैसे करें:
library (dplyr)
#calculate max of game2 and game3
df %>%
rowwise() %>%
mutate(max_points = max(c(game2, game3), na. rm = TRUE ))
# A tibble: 6 x 4
#Rowwise:
game1 game2 game3 max_points
1 22 12 NA 12
2 25 10 15 15
3 29 6 15 15
4 13 6 18 18
5 22 8 22 22
6 30 11 13 13
परिणाम से हम देख सकते हैं:
- पहली पंक्ति में गेम2 और गेम3 का अधिकतम मान 12 है।
- दूसरी पंक्ति में गेम2 और गेम3 का अधिकतम मान 15 है।
- तीसरी पंक्ति में गेम2 और गेम3 का अधिकतम मान 15 है।
और इसी तरह।
उदाहरण 3: प्रत्येक पंक्ति में विशिष्ट स्तंभों का मानक विचलन
निम्नलिखित कोड दिखाता है कि डेटा फ़्रेम में प्रत्येक पंक्ति के लिए गेम2 और गेम3 कॉलम में मानों के मानक विचलन की गणना कैसे करें:
library (dplyr)
#calculate standard deviation of game2 and game3
df %>%
rowwise() %>%
mutate(sd_points = sd(c(game2, game3), na. rm = TRUE ))
# A tibble: 6 x 4
#Rowwise:
game1 game2 game3 sd_points
1 22 12 NA NA
2 25 10 15 3.54
3 29 6 15 6.36
4 13 6 18 8.49
5 22 8 22 9.90
6 30 11 13 1.41
परिणाम से हम देख सकते हैं:
- पहली पंक्ति में गेम2 और गेम3 का मानक विचलन NA है (चूंकि मानक विचलन की गणना एक मान से नहीं की जा सकती)।
- दूसरी पंक्ति में गेम2 और गेम3 का मानक विचलन 3.54 है।
- पहली पंक्ति में गेम2 और गेम3 का मानक विचलन 6.36 है ।
और इसी तरह।
नोट : आप यहां dplyr में पंक्तिवार() फ़ंक्शन का पूरा दस्तावेज़ पा सकते हैं।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि dplyr का उपयोग करके अन्य सामान्य कार्य कैसे करें:
Dplyr का उपयोग करके विशिष्ट मानों की गणना कैसे करें
Dplyr का उपयोग करके एकाधिक स्तंभों का योग कैसे करें
Dplyr का उपयोग करके डेटा फ़्रेम में एकाधिक मानों को कैसे बदलें