डेटा को विभाजित करने के लिए r में स्प्लिट() फ़ंक्शन का उपयोग कैसे करें
आर में स्प्लिट() फ़ंक्शन का उपयोग कारक स्तरों के आधार पर डेटा को समूहों में विभाजित करने के लिए किया जा सकता है।
यह फ़ंक्शन निम्नलिखित मूल सिंटैक्स का उपयोग करता है:
विभाजित करें(x, f,…)
सोना:
- x : समूहों में विभाजित करने के लिए वेक्टर या डेटा ब्लॉक का नाम
- एफ : एक कारक जो समूहों को परिभाषित करता है
निम्नलिखित उदाहरण दिखाते हैं कि वैक्टर और डेटा फ़्रेम को समूहों में विभाजित करने के लिए इस फ़ंक्शन का उपयोग कैसे करें।
उदाहरण 1: वेक्टर को समूहों में विभाजित करने के लिए स्प्लिट() का उपयोग करें
निम्नलिखित कोड दिखाता है कि कारक स्तरों के वेक्टर के आधार पर डेटा मानों के वेक्टर को समूहों में कैसे विभाजित किया जाए:
#create vector of data values data <- c(1, 2, 3, 4, 5, 6) #create vector of groupings groups <- c('A', 'B', 'B', 'B', 'C', 'C') #split vector of data values into groups split(x = data, f = groups) $A [1] 1 $B [1] 2 3 4 $C [1] 5 6
परिणाम तीन समूह है.
ध्यान दें कि आप विशिष्ट समूहों को पुनः प्राप्त करने के लिए अनुक्रमण का भी उपयोग कर सकते हैं:
#split vector of data values into groups and only display second group
split(x = data, f = groups)[2]
$B
[1] 2 3 4
उदाहरण 2: डेटा फ़्रेम को समूहों में विभाजित करने के लिए स्प्लिट() का उपयोग करें
मान लीजिए कि हमारे पास R में निम्नलिखित डेटा फ़्रेम है:
#create data frame df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'), position=c('G', 'G', 'F', 'G', 'F', 'F'), points=c(33, 28, 31, 39, 34, 44), assists=c(30, 28, 24, 24, 28, 19)) #view data frame df team position points assists 1 GA 33 30 2 AG 28 28 3 AF 31 24 4 BG 39 24 5 BF 34 28 6 BF 44 19
हम डेटा फ़्रेम को “टीम” वेरिएबल के आधार पर समूहों में विभाजित करने के लिए निम्नलिखित कोड का उपयोग कर सकते हैं:
#split data frame into groups based on 'team'
split(df, f = df$team)
$A
team position points assists
1 GA 33 30
2 AG 28 28
3 AF 31 24
$B
team position points assists
4 BG 39 24
5 BF 34 28
6 BF 44 19
परिणाम दो समूह हैं. पहले में केवल वे पंक्तियाँ हैं जहाँ “टीम” A के बराबर है और दूसरे में केवल वे पंक्तियाँ हैं जहाँ “टीम” B के बराबर है।
ध्यान दें कि हम कई कारक चर का उपयोग करके डेटा को समूहों में भी विभाजित कर सकते हैं। उदाहरण के लिए, निम्नलिखित कोड दिखाता है कि डेटा को “टीम” और “स्थिति” चर के आधार पर समूहों में कैसे विभाजित किया जाए:
#split data frame into groups based on 'team' and 'position' variables
split(df, f = list(df$team, df$position))
$AF
team position points assists
3 AF 31 24
$BF
team position points assists
5 BF 34 28
6 BF 44 19
$AG
team position points assists
1 GA 33 30
2 AG 28 28
$BG
team position points assists
4 BG 39 24
परिणाम चार समूह है.
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि R में अन्य सामान्य फ़ंक्शंस का उपयोग कैसे करें:
आर में सारांश() फ़ंक्शन का उपयोग कैसे करें
आर में रिप्लिकेट() फ़ंक्शन का उपयोग कैसे करें
आर में मैच() फ़ंक्शन का उपयोग कैसे करें