आर में मानों की सूची के आधार पर डेटा फ़्रेम को कैसे सब्मिट करें


आप R में मानों की सूची द्वारा डेटा फ़्रेम को उप-परिभाषित करने के लिए निम्न विधियों में से किसी एक का उपयोग कर सकते हैं:

विधि 1: बेस आर का उपयोग करें

 df_new <- df[df$my_column %in% vals,]

विधि 2: dplyr का उपयोग करें

 library (dplyr)

df_new <- filter(df, my_column %in% vals)

विधि 3: डेटा.टेबल का उपयोग करें

 library (data.table)

df_new <- setDT(df, key=' my_column ')[J(vals)]

निम्नलिखित उदाहरण दिखाते हैं कि आर में निम्नलिखित डेटा फ्रेम के साथ अभ्यास में इनमें से प्रत्येक विधि का उपयोग कैसे करें:

 #create data frame
df <- data. frame (team=c('A', 'B', 'B', 'B', 'C', 'C', 'C', 'D'),
                 points=c(12, 22, 35, 34, 20, 28, 30, 18),
                 assists=c(4, 10, 11, 12, 12, 8, 6, 10))

#view data frame
df

  team points assists
1 to 12 4
2 B 22 10
3 B 35 11
4 B 34 12
5 C 20 12
6 C 28 8
7 C 30 6
8 D 18 10

विधि 1: आर बेस में मानों की सूची के अनुसार डेटा फ़्रेम का सबसेट

निम्नलिखित कोड दिखाता है कि डेटा फ़्रेम को कैसे सब्मिट किया जाए ताकि इसमें टीम कॉलम में केवल “ए” या “सी” मान वाली पंक्तियाँ हों:

 #define values to subset by
vals <- c(' A ', ' C ')

#subset data frame to only contain rows where team is 'A' or 'C'
df_new <- df[df$team %in% vals,]

#view results
df_new

  team points assists
1 to 12 4
5 C 20 12
6 C 28 8
7 C 30 6

परिणामी डेटा फ़्रेम में केवल वे पंक्तियाँ होती हैं जिनमें टीम कॉलम में “ए” या “सी” मान होता है।

ध्यान दें कि हमने इस उदाहरण में बुनियादी आर फ़ंक्शंस का उपयोग किया है, इसलिए हमें कोई अतिरिक्त पैकेज लोड नहीं करना पड़ेगा।

विधि 2: dplyr में मानों की सूची के अनुसार डेटाफ़्रेम उपसमुच्चय

निम्नलिखित कोड दिखाता है कि dplyr पैकेज से फ़िल्टर() फ़ंक्शन का उपयोग करके टीम कॉलम में केवल “ए” या “सी” मान वाली पंक्तियों को शामिल करने के लिए डेटा फ़्रेम को कैसे उप-सेट किया जाए:

 library (dplyr)

#define values to subset by
vals <- c(' A ', ' C ')

#subset data frame to only contain rows where team is 'A' or 'C'
df_new <- filter(df, team %in% vals)

#view results
df_new

  team points assists
1 to 12 4
5 C 20 12
6 C 28 8
7 C 30 6

परिणामी डेटा फ़्रेम में केवल वे पंक्तियाँ होती हैं जिनमें टीम कॉलम में “ए” या “सी” मान होता है।

विधि 3: data.table में मानों की सूची के अनुसार डेटाफ़्रेम को सब्मिट करें

निम्नलिखित कोड दिखाता है कि data.table पैकेज में फ़ंक्शन का उपयोग करके टीम कॉलम में केवल “ए” या “सी” मान वाली पंक्तियों को शामिल करने के लिए डेटा फ़्रेम को कैसे उप-सेट किया जाए:

 library (data.table)

#define values to subset by
vals <- c(' A ', ' C ')

#subset data frame to only contain rows where team is 'A' or 'C'
df_new <- setDT(df, key=' team ')[J(vals)]

#view results
df_new

   team points assists
1: A 12 4
2: C 20 12
3: C 28 8
4: C 30 6

परिणामी डेटा फ़्रेम में केवल वे पंक्तियाँ होती हैं जिनमें टीम कॉलम में “ए” या “सी” मान होता है।

संबंधित: R में %in% ऑपरेटर का उपयोग कैसे करें (उदाहरण के साथ)

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य कार्य कैसे करें:

आर में कारक स्तरों द्वारा डेटा फ़्रेम को कैसे उप-सेट करें
आर में दिनांक सीमा द्वारा उप-परिभाषित कैसे करें
आर में डेटा फ़्रेम का सबसेट कैसे प्लॉट करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *