R တွင် na.rm ကိုအသုံးပြုနည်း (ဥပမာများနှင့်အတူ)


R တွင် သရုပ်ဖော်ကိန်းဂဏန်းများကို တွက်ချက်ရာတွင် ပျောက်နေသောတန်ဖိုးများကို ဖယ်ထုတ်ရန် na.rm=TRUE အကြောင်းပြချက်ကို သင်သုံးနိုင်သည်။

 #calculate mean and exclude missing values
mean(x, na. rm = TRUE )

#calculate sum and exclude missing values 
sum(x, na. rm = TRUE )

#calculate maximum and exclude missing values 
max(x, na. rm = TRUE )

#calculate standard deviation and exclude missing values 
sd(x, na. rm = TRUE )

အောက်ပါဥပမာများသည် vectors နှင့် data frames များနှင့်အတူ လက်တွေ့တွင် ဤအငြင်းအခုံကိုအသုံးပြုပုံကို ပြသထားသည်။

ဥပမာ 1- na.rm ကို vector များဖြင့် အသုံးပြုခြင်း။

ပျောက်ဆုံးနေသောတန်ဖိုးများပါရှိသော R တွင်အောက်ပါ vector ၏ပျမ်းမျှ၊ ပေါင်းလဒ်၊ အမြင့်ဆုံးနှင့် စံသွေဖည်မှုကို တွက်ချက်ရန် ကြိုးစားနေသည်ဆိုပါစို့။

 #define vector with some missing values
x <- c(3, 4, 5, 5, 7, NA, 12, NA, 16)

mean(x)

[1] NA

sum(x)

[1] NA

max(x)

[1] NA

sd(x)

[1] NA

ဤလုပ်ဆောင်ချက်တစ်ခုစီသည် NA တန်ဖိုးကို ပြန်ပေးသည်။

ဤတွက်ချက်မှုများလုပ်ဆောင်ရာတွင် ပျောက်ဆုံးနေသောတန်ဖိုးများကို ဖယ်ထုတ်ရန်၊ အောက်ပါအတိုင်း argument na.rm = TRUE ကို ရိုးရိုးရှင်းရှင်း ထည့်သွင်းနိုင်ပါသည်။

 #define vector with some missing values
x <- c(3, 4, 5, 5, 7, NA, 12, NA, 16)

mean(x, na. rm = TRUE )

[1] 7.428571

sum(x, na. rm = TRUE )

[1] 52

max(x, na. rm = TRUE )

[1] 16

sd(x, na. rm = TRUE )

[1] 4.790864

ပျောက်ဆုံးနေသောတန်ဖိုးများမပါဝင်ဘဲ တွက်ချက်မှုတစ်ခုစီကို အောင်မြင်စွာလုပ်ဆောင်နိုင်ခဲ့ကြောင်း သတိပြုပါ။

ဥပမာ 2- ဒေတာဘောင်များဖြင့် na.rm ကို အသုံးပြုခြင်း။

ပျောက်ဆုံးနေသောတန်ဖိုးများပါရှိသော R တွင် အောက်ပါဒေတာဘောင်ရှိသည်ဆိုပါစို့။

 #create data frame
df <- data. frame (var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, NA, 3, 2),
                 var3=c(3, 3, NA, 6, 8),
                 var4=c(1, 1, 2, 8, NA))

#view data frame
df

  var1 var2 var3 var4
1 1 7 3 1
2 3 7 3 1
3 3 NA NA 2
4 4 3 6 8
5 5 2 8 NA

ဒေတာဘောင်ရှိ ကော်လံတစ်ခုစီအတွက် ဖော်ပြချက်ကိန်းဂဏန်းများကို တွက်ချက်ရန် apply() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပြီး ဤတွက်ချက်မှုများကို လုပ်ဆောင်သည့်အခါ ပျောက်ဆုံးနေသောတန်ဖိုးများကို ဖယ်ထုတ်ရန် argument na.rm = TRUE ကို အသုံးပြုနိုင်ပါသည်။

 #calculate mean of each column
apply(df, 2, mean, na. rm = TRUE )

var1 var2 var3 var4 
3.20 4.75 5.00 3.00 

#calculate sum of each column
apply(df, 2, sum, na. rm = TRUE )

var1 var2 var3 var4 
  16 19 20 12 

#calculate max of each column
apply(df, 2, max, na. rm = TRUE )

var1 var2 var3 var4 
   5 7 8 8 

#calculate standard deviation of each column
apply(df, 2, sd, na. rm = TRUE )

    var1 var2 var3 var4 
1.483240 2.629956 2.449490 3.366502

တစ်ဖန်၊ ကျွန်ုပ်တို့သည် ပျောက်ဆုံးနေသောတန်ဖိုးများကို မပါဝင်ဘဲ တွက်ချက်မှုတစ်ခုစီကို အောင်မြင်စွာ အပြီးသတ်နိုင်ခဲ့သည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် ပျောက်ဆုံးနေသောတန်ဖိုးများနှင့်အတူ အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

R တွင် is.null ကိုအသုံးပြုနည်း
R တွင် na.omit ကိုအသုံးပြုနည်း
R တွင် is.na ကိုအသုံးပြုနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်