R में na.rm का उपयोग कैसे करें (उदाहरण के साथ)


आर में वर्णनात्मक आंकड़ों की गणना करते समय लापता मानों को बाहर करने के लिए आप na.rm=TRUE तर्क का उपयोग कर सकते हैं।

 #calculate mean and exclude missing values
mean(x, na. rm = TRUE )

#calculate sum and exclude missing values 
sum(x, na. rm = TRUE )

#calculate maximum and exclude missing values 
max(x, na. rm = TRUE )

#calculate standard deviation and exclude missing values 
sd(x, na. rm = TRUE )

निम्नलिखित उदाहरण दिखाते हैं कि वैक्टर और डेटा फ़्रेम के साथ व्यवहार में इस तर्क का उपयोग कैसे करें।

उदाहरण 1: वैक्टर के साथ na.rm का उपयोग करना

मान लीजिए कि हम आर में निम्नलिखित वेक्टर के माध्य, योग, अधिकतम और मानक विचलन की गणना करने की कोशिश कर रहे हैं जिसमें लापता मान हैं:

 #define vector with some missing values
x <- c(3, 4, 5, 5, 7, NA, 12, NA, 16)

mean(x)

[1] NA

sum(x)

[1] NA

max(x)

[1] NA

sd(x)

[1] NA

इनमें से प्रत्येक फ़ंक्शन NA का मान लौटाता है।

इन गणनाओं को निष्पादित करते समय लापता मानों को बाहर करने के लिए, हम केवल तर्क na.rm = TRUE को निम्नानुसार शामिल कर सकते हैं:

 #define vector with some missing values
x <- c(3, 4, 5, 5, 7, NA, 12, NA, 16)

mean(x, na. rm = TRUE )

[1] 7.428571

sum(x, na. rm = TRUE )

[1] 52

max(x, na. rm = TRUE )

[1] 16

sd(x, na. rm = TRUE )

[1] 4.790864

ध्यान दें कि हम लापता मानों को छोड़कर प्रत्येक गणना सफलतापूर्वक करने में सक्षम थे।

उदाहरण 2: डेटा फ़्रेम के साथ na.rm का उपयोग करना

मान लीजिए कि हमारे पास आर में निम्नलिखित डेटा फ्रेम है जिसमें लापता मान हैं:

 #create data frame
df <- data. frame (var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, NA, 3, 2),
                 var3=c(3, 3, NA, 6, 8),
                 var4=c(1, 1, 2, 8, NA))

#view data frame
df

  var1 var2 var3 var4
1 1 7 3 1
2 3 7 3 1
3 3 NA NA 2
4 4 3 6 8
5 5 2 8 NA

हम डेटा फ्रेम में प्रत्येक कॉलम के लिए वर्णनात्मक आंकड़ों की गणना करने के लिए लागू() फ़ंक्शन का उपयोग कर सकते हैं और इन गणनाओं को निष्पादित करते समय लापता मानों को बाहर करने के लिए तर्क na.rm = TRUE का उपयोग कर सकते हैं:

 #calculate mean of each column
apply(df, 2, mean, na. rm = TRUE )

var1 var2 var3 var4 
3.20 4.75 5.00 3.00 

#calculate sum of each column
apply(df, 2, sum, na. rm = TRUE )

var1 var2 var3 var4 
  16 19 20 12 

#calculate max of each column
apply(df, 2, max, na. rm = TRUE )

var1 var2 var3 var4 
   5 7 8 8 

#calculate standard deviation of each column
apply(df, 2, sd, na. rm = TRUE )

    var1 var2 var3 var4 
1.483240 2.629956 2.449490 3.366502

एक बार फिर, हम लापता मानों को छोड़कर प्रत्येक गणना को सफलतापूर्वक पूरा करने में सक्षम थे।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि आर में लापता मानों के साथ अन्य सामान्य कार्य कैसे करें:

R में is.null का उपयोग कैसे करें
R में na.omit का उपयोग कैसे करें
R में is.na का उपयोग कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *