आर में एक अलग फ़ंक्शन का उपयोग कैसे करें (उदाहरण के साथ)


Tidyr पैकेज के सेपरेट() फ़ंक्शन का उपयोग डेटा फ़्रेम कॉलम को कई कॉलमों में अलग करने के लिए किया जा सकता है।

यह फ़ंक्शन निम्नलिखित मूल सिंटैक्स का उपयोग करता है:

अलग (डेटा, कॉलम, में, सितम्बर)

सोना:

  • डेटा : डेटा फ़्रेम का नाम
  • col : अलग करने के लिए कॉलम का नाम
  • में : कॉलम के लिए नामों का वेक्टर अलग किया जाना है
  • सितम्बर : कॉलम को अलग करने का मान

निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इस फ़ंक्शन का उपयोग कैसे करें।

उदाहरण 1: कॉलम को दो कॉलम में विभाजित करें

मान लीजिए कि हमारे पास R में निम्नलिखित डेटा फ़्रेम है:

 #create data frame
df <- data. frame (player=c('A', 'A', 'B', 'B', 'C', 'C'),
                 year=c(1, 2, 1, 2, 1, 2),
                 stats=c('22-2', '29-3', '18-6', '11-8', '12-5', '19-2'))

#view data frame
df

  player year stats
1 A 1 22-2
2 A 2 29-3
3 B 1 18-6
4 B 2 11-8
5 C 1 12-5
6 C 2 19-2

हम सांख्यिकी कॉलम को “पॉइंट्स” और “असिस्ट्स” नामक दो नए कॉलमों में अलग करने के लिए सेपरेट() फ़ंक्शन का उपयोग इस प्रकार कर सकते हैं:

 library (tidyr)

#separate stats column into points and assists columns
separate(df, col=stats, into=c(' points ', ' assists '), sep=' - ')

  player year points assists
1 A 1 22 2
2 A 2 29 3
3 B 1 18 6
4 B 2 11 8
5 C 1 12 5
6 C 2 19 2

उदाहरण 2: कॉलम को दो से अधिक कॉलम में विभाजित करें

मान लीजिए कि हमारे पास R में निम्नलिखित डेटा फ़्रेम है:

 #create data frame
df2 <- data. frame (player=c('A', 'A', 'B', 'B', 'C', 'C'),
                 year=c(1, 2, 1, 2, 1, 2),
                 stats=c('22/2/3', '29/3/4', '18/6/7', '11/1/2', '12/1/1', '19/2/4 '))

#view data frame
df2

  player year stats
1 A 1 22/2/3
2 A 2 29/3/4
3 B 1 18/6/7
4 B 2 11/1/2
5 C 1 12/1/1
6 C 2 19/2/4

हम सांख्यिकी कॉलम को तीन अलग-अलग कॉलमों में अलग करने के लिए सेपरेट() फ़ंक्शन का उपयोग कर सकते हैं:

 library (tidyr)

#separate stats column into three new columns
separate(df, col=stats, into=c(' points ', ' assists ', ' steals '), sep=' / ')

  player year points assists steals
1 A 1 22 2 3
2 A 2 29 3 4
3 B 1 18 6 7
4 B 2 11 1 2
5 C 1 12 1 1
6 C 2 19 2 4

अतिरिक्त संसाधन

Tidyr पैकेज का लक्ष्य “सुव्यवस्थित” डेटा बनाना है, जिसमें निम्नलिखित विशेषताएं हैं:

  • प्रत्येक स्तंभ एक चर है.
  • प्रत्येक पंक्ति एक अवलोकन है.
  • प्रत्येक कोशिका एक अद्वितीय मान है.

ऑर्डर किया गया डेटा बनाने के लिए Tidyr पैकेज चार मुख्य कार्यों का उपयोग करता है:

1. स्प्रेड() फ़ंक्शन।

2. इकट्ठा () फ़ंक्शन।

3. अलग() फ़ंक्शन।

4. यूनिट() फ़ंक्शन।

यदि आप इन चार कार्यों में महारत हासिल कर लेते हैं, तो आप किसी भी डेटा फ़्रेम से “सुव्यवस्थित” डेटा बनाने में सक्षम होंगे।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *