आर में स्प्रेड फ़ंक्शन का उपयोग कैसे करें (उदाहरण के साथ)


Tidyr पैकेज में स्प्रेड() फ़ंक्शन का उपयोग कई कॉलमों में एक कुंजी-मूल्य जोड़ी को “फैलाने” के लिए किया जा सकता है।

यह फ़ंक्शन निम्नलिखित मूल सिंटैक्स का उपयोग करता है:

प्रसार (डेटा, मुख्य मान)

सोना:

  • डेटा : डेटा फ़्रेम का नाम
  • key : कॉलम जिसका मान वेरिएबल नाम बन जाएगा
  • मान : वह कॉलम जहां कुंजी से बनाए गए नए वेरिएबल के अंतर्गत मान भरे जाएंगे

निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इस फ़ंक्शन का उपयोग कैसे करें।

उदाहरण 1: मानों को दो स्तंभों में फैलाएं

मान लीजिए कि हमारे पास R में निम्नलिखित डेटा फ़्रेम है:

 #create data frame
df <- data. frame (player= rep (c(' A ', ' B '), each= 4 ),
                 year= rep (c(1, 1, 2, 2), times= 2 ),
                 stat= rep (c(' points ', ' assists '), times= 4 ),
                 amount=c(14, 6, 18, 7, 22, 9, 38, 4))

#view data frame
df

  player year stat amount
1 A 1 points 14
2 A 1 assists 6
3 A 2 points 18
4 A 2 assists 7
5 B 1 points 22
6 B 1 assists 9
7 B 2 points 38
8 B 2 assists 4

हम स्टेट कॉलम मानों को उनके अपने कॉलम में बदलने के लिए स्प्रेड() फ़ंक्शन का उपयोग कर सकते हैं:

 library (tidyr)

#spread stat column across multiple columns
spread(df, key=stat, value=amount)

  player year assists points
1 to 1 6 14
2 to 2 7 18
3 B 1 9 22
4 B 2 4 38

उदाहरण 2: मानों को दो से अधिक स्तंभों में फैलाएँ

मान लीजिए कि हमारे पास R में निम्नलिखित डेटा फ़्रेम है:

 #create data frame
df2 <- data. frame (player= rep (c(' A '), times= 8 ),
                 year= rep (c(1, 2), each= 4 ),
                 stat= rep (c(' points ', ' assists ', ' steals ', ' blocks '), times= 2 ),
                 amount=c(14, 6, 2, 1, 29, 9, 3, 4))

#view data frame
df2

  player year stat amount
1 A 1 points 14
2 A 1 assists 6
3 A 1 steals 2
4 A 1 blocks 1
5 A 2 points 29
6 A 2 assists 9
7 A 2 steals 3
8 A 2 blocks 4

हम स्टेट कॉलम में चार अद्वितीय मानों को चार नए कॉलम में बदलने के लिए स्प्रेड() फ़ंक्शन का उपयोग कर सकते हैं:

 library (tidyr)

#spread stat column across multiple columns
spread(df2, key=stat, value=amount)

  player year assists blocks points steals
1 A 1 6 1 14 2
2 A 2 9 4 29 3

अतिरिक्त संसाधन

Tidyr पैकेज का लक्ष्य “सुव्यवस्थित” डेटा बनाना है, जिसमें निम्नलिखित विशेषताएं हैं:

  • प्रत्येक स्तंभ एक चर है.
  • प्रत्येक पंक्ति एक अवलोकन है.
  • प्रत्येक कोशिका एक अद्वितीय मान है.

ऑर्डर किया गया डेटा बनाने के लिए Tidyr पैकेज चार मुख्य कार्यों का उपयोग करता है:

1. स्प्रेड() फ़ंक्शन।

2. इकट्ठा () फ़ंक्शन।

3. अलग() फ़ंक्शन।

4. यूनिट() फ़ंक्शन।

यदि आप इन चार कार्यों में महारत हासिल कर लेते हैं, तो आप किसी भी डेटा फ़्रेम से “सुव्यवस्थित” डेटा बनाने में सक्षम होंगे।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *