आर में मानों की सूची के आधार पर डेटा फ़्रेम को कैसे सब्मिट करें
आप R में मानों की सूची द्वारा डेटा फ़्रेम को उप-परिभाषित करने के लिए निम्न विधियों में से किसी एक का उपयोग कर सकते हैं:
विधि 1: बेस आर का उपयोग करें
df_new <- df[df$my_column %in% vals,]
विधि 2: dplyr का उपयोग करें
library (dplyr)
df_new <- filter(df, my_column %in% vals)
विधि 3: डेटा.टेबल का उपयोग करें
library (data.table)
df_new <- setDT(df, key=' my_column ')[J(vals)]
निम्नलिखित उदाहरण दिखाते हैं कि आर में निम्नलिखित डेटा फ्रेम के साथ अभ्यास में इनमें से प्रत्येक विधि का उपयोग कैसे करें:
#create data frame
df <- data. frame (team=c('A', 'B', 'B', 'B', 'C', 'C', 'C', 'D'),
points=c(12, 22, 35, 34, 20, 28, 30, 18),
assists=c(4, 10, 11, 12, 12, 8, 6, 10))
#view data frame
df
team points assists
1 to 12 4
2 B 22 10
3 B 35 11
4 B 34 12
5 C 20 12
6 C 28 8
7 C 30 6
8 D 18 10
विधि 1: आर बेस में मानों की सूची के अनुसार डेटा फ़्रेम का सबसेट
निम्नलिखित कोड दिखाता है कि डेटा फ़्रेम को कैसे सब्मिट किया जाए ताकि इसमें टीम कॉलम में केवल “ए” या “सी” मान वाली पंक्तियाँ हों:
#define values to subset by vals <- c(' A ', ' C ') #subset data frame to only contain rows where team is 'A' or 'C' df_new <- df[df$team %in% vals,] #view results df_new team points assists 1 to 12 4 5 C 20 12 6 C 28 8 7 C 30 6
परिणामी डेटा फ़्रेम में केवल वे पंक्तियाँ होती हैं जिनमें टीम कॉलम में “ए” या “सी” मान होता है।
ध्यान दें कि हमने इस उदाहरण में बुनियादी आर फ़ंक्शंस का उपयोग किया है, इसलिए हमें कोई अतिरिक्त पैकेज लोड नहीं करना पड़ेगा।
विधि 2: dplyr में मानों की सूची के अनुसार डेटाफ़्रेम उपसमुच्चय
निम्नलिखित कोड दिखाता है कि dplyr पैकेज से फ़िल्टर() फ़ंक्शन का उपयोग करके टीम कॉलम में केवल “ए” या “सी” मान वाली पंक्तियों को शामिल करने के लिए डेटा फ़्रेम को कैसे उप-सेट किया जाए:
library (dplyr) #define values to subset by vals <- c(' A ', ' C ') #subset data frame to only contain rows where team is 'A' or 'C' df_new <- filter(df, team %in% vals) #view results df_new team points assists 1 to 12 4 5 C 20 12 6 C 28 8 7 C 30 6
परिणामी डेटा फ़्रेम में केवल वे पंक्तियाँ होती हैं जिनमें टीम कॉलम में “ए” या “सी” मान होता है।
विधि 3: data.table में मानों की सूची के अनुसार डेटाफ़्रेम को सब्मिट करें
निम्नलिखित कोड दिखाता है कि data.table पैकेज में फ़ंक्शन का उपयोग करके टीम कॉलम में केवल “ए” या “सी” मान वाली पंक्तियों को शामिल करने के लिए डेटा फ़्रेम को कैसे उप-सेट किया जाए:
library (data.table) #define values to subset by vals <- c(' A ', ' C ') #subset data frame to only contain rows where team is 'A' or 'C' df_new <- setDT(df, key=' team ')[J(vals)] #view results df_new team points assists 1: A 12 4 2: C 20 12 3: C 28 8 4: C 30 6
परिणामी डेटा फ़्रेम में केवल वे पंक्तियाँ होती हैं जिनमें टीम कॉलम में “ए” या “सी” मान होता है।
संबंधित: R में %in% ऑपरेटर का उपयोग कैसे करें (उदाहरण के साथ)
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य कार्य कैसे करें:
आर में कारक स्तरों द्वारा डेटा फ़्रेम को कैसे उप-सेट करें
आर में दिनांक सीमा द्वारा उप-परिभाषित कैसे करें
आर में डेटा फ़्रेम का सबसेट कैसे प्लॉट करें