आर में सूचीवार डिलीट कैसे करें (उदाहरण के साथ)


सूचीवार विलोपन एक ऐसी विधि है जो डेटा फ्रेम में उन सभी पंक्तियों को हटा देती है जिनके कॉलम में कोई मान गायब है।

R में सूचीवार विलोपन करने का सबसे आसान तरीका निम्नलिखित सिंटैक्स का उपयोग करना है:

 complete_df <- df[complete. boxes (df), ]

यह सिंटैक्स एक नया डेटा फ़्रेम बनाने के लिए कंपलीट.केस() फ़ंक्शन का उपयोग करता है जिसमें मूल डेटा फ़्रेम से केवल वे पंक्तियाँ होती हैं जिनके किसी भी कॉलम में कोई गुम मान नहीं होता है।

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस फ़ंक्शन का उपयोग कैसे करें।

उदाहरण: आर में सूचीवार विलोपन करें

मान लीजिए कि हमारे पास आर में निम्नलिखित डेटा फ्रेम है जिसमें विभिन्न बास्केटबॉल खिलाड़ियों के बारे में जानकारी है:

 #create data frame
df <- data. frame (rating=c(70, 75, 75, 78, 81, 85, 89, 91, 94, 97),
                 points=c(12, 15, 14, 13, NA, 29, 24, 18, 20, 25),
                 assists=c(9, 5, NA, 5, 7, 8, 11, 12, 13, 11))

#view data frame
df

   rating points assists
1 70 12 9
2 75 15 5
3 75 14 NA
4 78 13 5
5 81 NA 7
6 85 29 8
7 89 24 11
8 91 18 12
9 94 20 13
10 97 25 11

ध्यान दें कि दो पंक्तियों में कुछ स्तंभों में NA मान हैं।

हम सूचीवार विलोपन करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं और केवल उन पंक्तियों को रख सकते हैं जिनके किसी भी कॉलम में कोई लापता मान नहीं है:

 #create new data frame that only contains rows with no missing values
complete_df <- df[complete. boxes (df), ]

#view new data frame
complete_df

   rating points assists
1 70 12 9
2 75 15 5
4 78 13 5
6 85 29 8
7 89 24 11
8 91 18 12
9 94 20 13
10 97 25 11

ध्यान दें कि इस नए डेटा फ़्रेम की किसी भी पंक्ति में किसी भी कॉलम में खाली मान नहीं हैं।

यह भी ध्यान दें कि हम यह निर्धारित करने के लिए nrow() फ़ंक्शन का उपयोग कर सकते हैं कि मूल डेटा फ़्रेम में किसी भी कॉलम में कितनी पंक्तियों में गुम मान थे:

 #count how many rows have missing values in any column
nrow(df[ ! complete. cases (df), ])

[1] 2

यह हमें बताता है कि मूल डेटा फ़्रेम में 2 पंक्तियों में कम से कम एक कॉलम में मान गायब थे।

और हम उतनी ही आसानी से गिन सकते हैं कि कितनी पंक्तियों में किसी भी कॉलम में कोई लुप्त मान नहीं था:

 #count how many rows do not have missing values in any column
nrow(df[complete. cases (df), ])

[1] 8

यह हमें बताता है कि मूल डेटा फ़्रेम की 8 पंक्तियों में किसी भी कॉलम में गायब मान नहीं थे।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य कार्य कैसे करें:

आर में लुप्त मानों को कैसे खोजें और गिनें
आर में लुप्त मानों को कैसे प्रक्षेपित करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *