R में data.table के dcast फ़ंक्शन का उपयोग कैसे करें


आप डेटा के एक फ्रेम को लंबे प्रारूप से विस्तृत प्रारूप में दोबारा आकार देने के लिए R में data.table पैकेज के dcast फ़ंक्शन का उपयोग कर सकते हैं।

यह फ़ंक्शन विशेष रूप से तब उपयोगी होता है जब आप डेटा फ़्रेम में विशिष्ट चर को अन्य चर द्वारा समूहीकृत करना चाहते हैं।

निम्नलिखित उदाहरण दिखाते हैं कि आर में निम्नलिखित डेटा फ्रेम के साथ अभ्यास में डीकास्ट फ़ंक्शन का उपयोग कैसे करें:

 library (data.table)

#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 position=c('G', 'G', 'F', 'F', 'G', 'G', 'F', 'F'),
                 points=c(18, 13, 10, 12, 16, 25, 24, 31),
                 assists=c(9, 8, 8, 5, 12, 15, 10, 7))

#convert data frame to data table
dt <- setDT(df)

#view data table
dt

   team position points assists
1: AG 18 9
2: AG 13 8
3:AF 10 8
4:AF 12 5
5: BG 16 12
6: BG 25 15
7: BF 24 10
8: BF 31 7

उदाहरण 1: अन्य चरों द्वारा समूहीकृत एक चर के लिए मीट्रिक की गणना करें

निम्नलिखित कोड दिखाता है कि टीम और स्थिति चर द्वारा समूहीकृत औसत बिंदु मान की गणना करने के लिए dcast फ़ंक्शन का उपयोग कैसे करें:

 library (data.table)

#calculate mean points value by team and position
dt_new <- dcast(dt,
                team + position ~.,
                fun. aggregate = mean, 
                value. var = ' points ')

#view results
dt_new

   team position.
1:AF 11.0
2: AG 15.5
3: BF 27.5
4: BG 20.5

उदाहरण 2: एक चर के लिए अन्य चर द्वारा समूहीकृत अनेक मैट्रिक्स की गणना करें

निम्नलिखित कोड दिखाता है कि टीम और स्थिति चर द्वारा समूहीकृत औसत बिंदु मान और अधिकतम बिंदु मान की गणना करने के लिए dcast फ़ंक्शन का उपयोग कैसे करें:

 library (data.table)

#calculate mean and max points values by team and position
dt_new <- dcast(dt,
                team + position ~.,
                fun. aggregate = list(mean, max), 
                value. var = ' points ')

#view results
dt_new

   team position points_mean points_max
1:AF 11.0 12
2: AG 15.5 18
3: BF 27.5 31
4: BG 20.5 25

उदाहरण 3: अन्य चरों द्वारा समूहीकृत, अनेक चरों के लिए मीट्रिक की गणना करें

निम्नलिखित कोड दिखाता है कि टीम और स्थिति चर द्वारा समूहीकृत औसत बिंदु मान और औसत सहायता मूल्य की गणना करने के लिए dcast फ़ंक्शन का उपयोग कैसे करें:

 library (data.table)

#calculate mean and max points values by team and position
dt_new <- dcast(dt,
                team + position ~.,
                fun. aggregate = mean, 
                value. var = c(' points ', ' assists '))

#view results
dt_new

   team position points assists
1:AF 11.0 6.5
2: AG 15.5 8.5
3: BF 27.5 8.5
4: BG 20.5 13.5

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल डेटा तालिकाओं के बारे में अतिरिक्त जानकारी प्रदान करते हैं:

R में data.table बनाम डेटा फ़्रेम: तीन प्रमुख अंतर
आर में डेटा.टेबल को कैसे फ़िल्टर करें
एकाधिक से डेटा तालिका बनाने के लिए R में rbindlist का उपयोग कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *