आर में एक अलग फ़ंक्शन का उपयोग कैसे करें (उदाहरण के साथ)
Tidyr पैकेज के सेपरेट() फ़ंक्शन का उपयोग डेटा फ़्रेम कॉलम को कई कॉलमों में अलग करने के लिए किया जा सकता है।
यह फ़ंक्शन निम्नलिखित मूल सिंटैक्स का उपयोग करता है:
अलग (डेटा, कॉलम, में, सितम्बर)
सोना:
- डेटा : डेटा फ़्रेम का नाम
- col : अलग करने के लिए कॉलम का नाम
- में : कॉलम के लिए नामों का वेक्टर अलग किया जाना है
- सितम्बर : कॉलम को अलग करने का मान
निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इस फ़ंक्शन का उपयोग कैसे करें।
उदाहरण 1: कॉलम को दो कॉलम में विभाजित करें
मान लीजिए कि हमारे पास R में निम्नलिखित डेटा फ़्रेम है:
#create data frame df <- data. frame (player=c('A', 'A', 'B', 'B', 'C', 'C'), year=c(1, 2, 1, 2, 1, 2), stats=c('22-2', '29-3', '18-6', '11-8', '12-5', '19-2')) #view data frame df player year stats 1 A 1 22-2 2 A 2 29-3 3 B 1 18-6 4 B 2 11-8 5 C 1 12-5 6 C 2 19-2
हम सांख्यिकी कॉलम को “पॉइंट्स” और “असिस्ट्स” नामक दो नए कॉलमों में अलग करने के लिए सेपरेट() फ़ंक्शन का उपयोग इस प्रकार कर सकते हैं:
library (tidyr) #separate stats column into points and assists columns separate(df, col=stats, into=c(' points ', ' assists '), sep=' - ') player year points assists 1 A 1 22 2 2 A 2 29 3 3 B 1 18 6 4 B 2 11 8 5 C 1 12 5 6 C 2 19 2
उदाहरण 2: कॉलम को दो से अधिक कॉलम में विभाजित करें
मान लीजिए कि हमारे पास R में निम्नलिखित डेटा फ़्रेम है:
#create data frame df2 <- data. frame (player=c('A', 'A', 'B', 'B', 'C', 'C'), year=c(1, 2, 1, 2, 1, 2), stats=c('22/2/3', '29/3/4', '18/6/7', '11/1/2', '12/1/1', '19/2/4 ')) #view data frame df2 player year stats 1 A 1 22/2/3 2 A 2 29/3/4 3 B 1 18/6/7 4 B 2 11/1/2 5 C 1 12/1/1 6 C 2 19/2/4
हम सांख्यिकी कॉलम को तीन अलग-अलग कॉलमों में अलग करने के लिए सेपरेट() फ़ंक्शन का उपयोग कर सकते हैं:
library (tidyr) #separate stats column into three new columns separate(df, col=stats, into=c(' points ', ' assists ', ' steals '), sep=' / ') player year points assists steals 1 A 1 22 2 3 2 A 2 29 3 4 3 B 1 18 6 7 4 B 2 11 1 2 5 C 1 12 1 1 6 C 2 19 2 4
अतिरिक्त संसाधन
Tidyr पैकेज का लक्ष्य “सुव्यवस्थित” डेटा बनाना है, जिसमें निम्नलिखित विशेषताएं हैं:
- प्रत्येक स्तंभ एक चर है.
- प्रत्येक पंक्ति एक अवलोकन है.
- प्रत्येक कोशिका एक अद्वितीय मान है.
ऑर्डर किया गया डेटा बनाने के लिए Tidyr पैकेज चार मुख्य कार्यों का उपयोग करता है:
1. स्प्रेड() फ़ंक्शन।
2. इकट्ठा () फ़ंक्शन।
3. अलग() फ़ंक्शन।
4. यूनिट() फ़ंक्शन।
यदि आप इन चार कार्यों में महारत हासिल कर लेते हैं, तो आप किसी भी डेटा फ़्रेम से “सुव्यवस्थित” डेटा बनाने में सक्षम होंगे।