डेटा को विभाजित करने के लिए r में स्प्लिट() फ़ंक्शन का उपयोग कैसे करें


आर में स्प्लिट() फ़ंक्शन का उपयोग कारक स्तरों के आधार पर डेटा को समूहों में विभाजित करने के लिए किया जा सकता है।

यह फ़ंक्शन निम्नलिखित मूल सिंटैक्स का उपयोग करता है:

विभाजित करें(x, f,…)

सोना:

  • x : समूहों में विभाजित करने के लिए वेक्टर या डेटा ब्लॉक का नाम
  • एफ : एक कारक जो समूहों को परिभाषित करता है

निम्नलिखित उदाहरण दिखाते हैं कि वैक्टर और डेटा फ़्रेम को समूहों में विभाजित करने के लिए इस फ़ंक्शन का उपयोग कैसे करें।

उदाहरण 1: वेक्टर को समूहों में विभाजित करने के लिए स्प्लिट() का उपयोग करें

निम्नलिखित कोड दिखाता है कि कारक स्तरों के वेक्टर के आधार पर डेटा मानों के वेक्टर को समूहों में कैसे विभाजित किया जाए:

 #create vector of data values
data <- c(1, 2, 3, 4, 5, 6)

#create vector of groupings
groups <- c('A', 'B', 'B', 'B', 'C', 'C')

#split vector of data values into groups
split(x = data, f = groups)

$A
[1] 1

$B
[1] 2 3 4

$C
[1] 5 6

परिणाम तीन समूह है.

ध्यान दें कि आप विशिष्ट समूहों को पुनः प्राप्त करने के लिए अनुक्रमण का भी उपयोग कर सकते हैं:

 #split vector of data values into groups and only display second group
split(x = data, f = groups)[2]

$B
[1] 2 3 4

उदाहरण 2: डेटा फ़्रेम को समूहों में विभाजित करने के लिए स्प्लिट() का उपयोग करें

मान लीजिए कि हमारे पास R में निम्नलिखित डेटा फ़्रेम है:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'),
                 position=c('G', 'G', 'F', 'G', 'F', 'F'),
                 points=c(33, 28, 31, 39, 34, 44),
                 assists=c(30, 28, 24, 24, 28, 19))

#view data frame
df

  team position points assists
1 GA 33 30
2 AG 28 28
3 AF 31 24
4 BG 39 24
5 BF 34 28
6 BF 44 19

हम डेटा फ़्रेम को “टीम” वेरिएबल के आधार पर समूहों में विभाजित करने के लिए निम्नलिखित कोड का उपयोग कर सकते हैं:

 #split data frame into groups based on 'team'
split(df, f = df$team)

$A
  team position points assists
1 GA 33 30
2 AG 28 28
3 AF 31 24

$B
  team position points assists
4 BG 39 24
5 BF 34 28
6 BF 44 19

परिणाम दो समूह हैं. पहले में केवल वे पंक्तियाँ हैं जहाँ “टीम” A के बराबर है और दूसरे में केवल वे पंक्तियाँ हैं जहाँ “टीम” B के बराबर है।

ध्यान दें कि हम कई कारक चर का उपयोग करके डेटा को समूहों में भी विभाजित कर सकते हैं। उदाहरण के लिए, निम्नलिखित कोड दिखाता है कि डेटा को “टीम” और “स्थिति” चर के आधार पर समूहों में कैसे विभाजित किया जाए:

 #split data frame into groups based on 'team' and 'position' variables
split(df, f = list(df$team, df$position))

$AF
  team position points assists
3 AF 31 24

$BF
  team position points assists
5 BF 34 28
6 BF 44 19

$AG
  team position points assists
1 GA 33 30
2 AG 28 28

$BG
  team position points assists
4 BG 39 24

परिणाम चार समूह है.

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि R में अन्य सामान्य फ़ंक्शंस का उपयोग कैसे करें:

आर में सारांश() फ़ंक्शन का उपयोग कैसे करें
आर में रिप्लिकेट() फ़ंक्शन का उपयोग कैसे करें
आर में मैच() फ़ंक्शन का उपयोग कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *