आर में लुप्त मान कैसे खोजें और गिनें (उदाहरण के साथ)
आप R में लुप्त मानों को खोजने और गिनने के लिए निम्नलिखित विधियों का उपयोग कर सकते हैं:
विधि 1: लुप्त मानों का स्थान ज्ञात करें
which( is.na (df$column_name))
विधि 2: कुल लुप्त मानों की गणना करें
sum( is.na (df$column_name))
निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इन कार्यों का उपयोग कैसे करें।
उदाहरण 1: किसी कॉलम में लुप्त मान खोजें और गिनें
मान लीजिए हमारे पास निम्नलिखित डेटा फ़्रेम है:
#create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
points=c(99, 90, 86, 88, 95),
assists=c(NA, 28, NA, NA, 34),
rebounds=c(30, 28, 24, 24, NA))
#view data frame
df
team points assists rebounds
1 A 99 NA 30
2 B 90 28 28
3 C 86 NA 24
4 NA 88 NA 24
5 E 95 34 NA
हम “सहायता” कॉलम में गायब मान वाले पदों की पहचान करने और “सहायता” कॉलम में कुल लापता मान ढूंढने के लिए निम्नलिखित कोड का उपयोग कर सकते हैं:
#identify locations of missing values in 'assists' column
which( is.na (df$assists))
[1] 1 3 4
#count total missing values in 'assists' column
sum( is.na (df$assists))
[1] 3
परिणाम से हम देख सकते हैं कि स्थिति 1 , 3 और 4 में ‘सहायता’ कॉलम में लापता मान हैं और कॉलम में कुल 3 लापता मान हैं।
उदाहरण 2: सभी स्तंभों में लुप्त मानों की गणना करें
निम्नलिखित कोड दिखाता है कि डेटा फ़्रेम के प्रत्येक कॉलम में कुल लापता मानों की गणना कैसे करें:
#create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
points=c(99, 90, 86, 88, 95),
assists=c(NA, 28, NA, NA, 34),
rebounds=c(30, 28, 24, 24, NA))
#count total missing values in each column of data frame
sapply(df, function (x) sum(is. na (x)))
team points assists rebounds
1 0 3 1
परिणाम से हम देख सकते हैं:
- “टीम” कॉलम में 1 लुप्त मान है।
- “अंक” कॉलम में 0 लुप्त मान हैं।
- “सहायता” कॉलम में 3 लुप्त मान हैं।
- “रिबाउंड्स” कॉलम में 1 लुप्त मान है।
उदाहरण 3: संपूर्ण डेटा फ़्रेम में लुप्त मानों की गणना करें
निम्नलिखित कोड दिखाता है कि संपूर्ण डेटा फ़्रेम में कुल लुप्त मानों की गणना कैसे करें:
#create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
points=c(99, 90, 86, 88, 95),
assists=c(NA, 28, NA, NA, 34),
rebounds=c(30, 28, 24, 24, NA))
#count total missing values in entire data frame
sum( is.na (df))
[1] 5
परिणाम से, हम देख सकते हैं कि संपूर्ण डेटा फ़्रेम में कुल मिलाकर 5 लुप्त मान हैं।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि आर में लापता मानों के साथ अन्य सामान्य ऑपरेशन कैसे करें:
R में सभी लुप्त मानों को कैसे आरोपित करें
आर में एनएएस को स्ट्रिंग्स से कैसे बदलें
dplyr में NA को शून्य से कैसे बदलें