आर में स्प्रेड फ़ंक्शन का उपयोग कैसे करें (उदाहरण के साथ)
Tidyr पैकेज में स्प्रेड() फ़ंक्शन का उपयोग कई कॉलमों में एक कुंजी-मूल्य जोड़ी को “फैलाने” के लिए किया जा सकता है।
यह फ़ंक्शन निम्नलिखित मूल सिंटैक्स का उपयोग करता है:
प्रसार (डेटा, मुख्य मान)
सोना:
- डेटा : डेटा फ़्रेम का नाम
- key : कॉलम जिसका मान वेरिएबल नाम बन जाएगा
- मान : वह कॉलम जहां कुंजी से बनाए गए नए वेरिएबल के अंतर्गत मान भरे जाएंगे
निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इस फ़ंक्शन का उपयोग कैसे करें।
उदाहरण 1: मानों को दो स्तंभों में फैलाएं
मान लीजिए कि हमारे पास R में निम्नलिखित डेटा फ़्रेम है:
#create data frame df <- data. frame (player= rep (c(' A ', ' B '), each= 4 ), year= rep (c(1, 1, 2, 2), times= 2 ), stat= rep (c(' points ', ' assists '), times= 4 ), amount=c(14, 6, 18, 7, 22, 9, 38, 4)) #view data frame df player year stat amount 1 A 1 points 14 2 A 1 assists 6 3 A 2 points 18 4 A 2 assists 7 5 B 1 points 22 6 B 1 assists 9 7 B 2 points 38 8 B 2 assists 4
हम स्टेट कॉलम मानों को उनके अपने कॉलम में बदलने के लिए स्प्रेड() फ़ंक्शन का उपयोग कर सकते हैं:
library (tidyr) #spread stat column across multiple columns spread(df, key=stat, value=amount) player year assists points 1 to 1 6 14 2 to 2 7 18 3 B 1 9 22 4 B 2 4 38
उदाहरण 2: मानों को दो से अधिक स्तंभों में फैलाएँ
मान लीजिए कि हमारे पास R में निम्नलिखित डेटा फ़्रेम है:
#create data frame df2 <- data. frame (player= rep (c(' A '), times= 8 ), year= rep (c(1, 2), each= 4 ), stat= rep (c(' points ', ' assists ', ' steals ', ' blocks '), times= 2 ), amount=c(14, 6, 2, 1, 29, 9, 3, 4)) #view data frame df2 player year stat amount 1 A 1 points 14 2 A 1 assists 6 3 A 1 steals 2 4 A 1 blocks 1 5 A 2 points 29 6 A 2 assists 9 7 A 2 steals 3 8 A 2 blocks 4
हम स्टेट कॉलम में चार अद्वितीय मानों को चार नए कॉलम में बदलने के लिए स्प्रेड() फ़ंक्शन का उपयोग कर सकते हैं:
library (tidyr) #spread stat column across multiple columns spread(df2, key=stat, value=amount) player year assists blocks points steals 1 A 1 6 1 14 2 2 A 2 9 4 29 3
अतिरिक्त संसाधन
Tidyr पैकेज का लक्ष्य “सुव्यवस्थित” डेटा बनाना है, जिसमें निम्नलिखित विशेषताएं हैं:
- प्रत्येक स्तंभ एक चर है.
- प्रत्येक पंक्ति एक अवलोकन है.
- प्रत्येक कोशिका एक अद्वितीय मान है.
ऑर्डर किया गया डेटा बनाने के लिए Tidyr पैकेज चार मुख्य कार्यों का उपयोग करता है:
1. स्प्रेड() फ़ंक्शन।
2. इकट्ठा () फ़ंक्शन।
3. अलग() फ़ंक्शन।
4. यूनिट() फ़ंक्शन।
यदि आप इन चार कार्यों में महारत हासिल कर लेते हैं, तो आप किसी भी डेटा फ़्रेम से “सुव्यवस्थित” डेटा बनाने में सक्षम होंगे।