R တွင် ပျောက်ဆုံးနေသောတန်ဖိုးများကို မည်သို့စွပ်စွဲမည်နည်း (ဥပမာများဖြင့်)


မကြာခဏဆိုသလို သင်သည် R ရှိ ဒေတာဘောင်တစ်ခု၏ကော်လံများတွင် ပျောက်ဆုံးနေသောတန်ဖိုးများကို ထိုကော်လံ၏ပျမ်းမျှ သို့မဟုတ် အလယ်အလတ်ဖြင့် အစားထိုးလိုပေမည်။

ကော်လံတစ်ခုတည်းတွင် ပျောက်ဆုံးနေသောတန်ဖိုးများကို အစားထိုးရန်၊ အောက်ပါ syntax ကို သင်အသုံးပြုနိုင်သည်-

 df$col[ is.na (df$col)] <- mean(df$col, na.rm = TRUE )

ကော်လံအများအပြားတွင် ပျောက်ဆုံးနေသောတန်ဖိုးများကို အစားထိုးရန်၊ သင်သည် အောက်ပါအထားအသိုကို အသုံးပြုနိုင်သည်။

 for(i in 1: ncol (df)) {
  df[ , i][ is.na (df[ , i])] <- mean(df[ , i], na.rm = TRUE )
}

ဤသင်ခန်းစာတွင် ဤလုပ်ဆောင်ချက်များကို လက်တွေ့အသုံးချနည်းကို အတိအကျ ရှင်းပြထားသည်။

ဥပမာ 1- ပျောက်ဆုံးနေသောတန်ဖိုးများကို ကော်လံပျမ်းမျှများဖြင့် အစားထိုးပါ။

အောက်ပါကုဒ်သည် ဒေတာဘောင်တစ်ခု၏ ပထမကော်လံတွင် ပျောက်ဆုံးနေသောတန်ဖိုးများကို ပထမကော်လံ၏ ပျမ်းမျှတန်ဖိုးနှင့် မည်သို့အစားထိုးရမည်ကို ပြသသည်-

 #create data frame
df <- data.frame(var1=c(1, NA, NA, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9))

#replace missing values in first column with mean of first column
df$var1[ is.na (df$var1)] <- mean(df$var1, na.rm = TRUE )

#view data frame with missing values replaced
df

      var1 var2 var3 var4
1 1.000000 7 3 1
2 3.333333 7 3 1
3 3.333333 8 6 2
4 4.000000 3 6 8
5 5.000000 2 8 9

ပထမကော်လံရှိ ပျမ်းမျှတန်ဖိုးသည် 3.333 ဖြစ်သောကြောင့် ပထမကော်လံရှိ ပျောက်ဆုံးတန်ဖိုးများကို 3.333 ဖြင့် အစားထိုးခဲ့သည်။

အောက်ပါကုဒ်သည် ကော်လံတစ်ခုစီရှိ ပျောက်ဆုံးနေသောတန်ဖိုးများကို ၎င်း၏ကိုယ်ပိုင်ကော်လံ၏ ပျမ်းမျှအားဖြင့် မည်သို့အစားထိုးရမည်ကို ပြသသည်-

 #create data frame
df <- data.frame(var1=c(1, NA, NA, 4, 5),
                 var2=c(7, 7, 8, NA, 2),
                 var3=c(NA, 3, 6, NA, 8),
                 var4=c(1, 1, 2, 8, 9))

#replace missing values in each column with column means
for(i in 1: ncol (df)) {
  df[ , i][ is.na (df[ , i])] <- mean(df[ , i], na.rm = TRUE )
}

#view data frame with missing values replaced
df

      var1 var2 var3 var4
1 1.000000 7 5.666667 1
2 3.333333 7 3.000000 1
3 3.333333 8 6.000000 2
4 4.000000 6 5.666667 8
5 5.000000 2 8.000000 9

ဥပမာ 2- ပျောက်ဆုံးနေသောတန်ဖိုးများကို ကော်လံ medians ဖြင့် အစားထိုးပါ။

အောက်ပါကုဒ်သည် ဒေတာဘောင်တစ်ခု၏ ပထမကော်လံတွင် ပျောက်ဆုံးနေသောတန်ဖိုးများကို ပထမကော်လံ၏ ပျမ်းမျှတန်ဖိုးဖြင့် အစားထိုးနည်းကို ပြသသည်-

 #create data frame
df <- data.frame(var1=c(1, NA, NA, 4, 5),
                 var2=c(7, 7, 8, NA, 2),
                 var3=c(NA, 3, 6, NA, 8),
                 var4=c(1, 1, 2, 8, 9))

#replace missing values in first column with median of first column
df$var1[ is.na (df$var1)] <- median(df$var1, na.rm = TRUE )

#view data frame with missing values replaced
df

  var1 var2 var3 var4
1 1 7 NA 1
2 4 7 3 1
3 4 8 6 2
4 4 NA NA 8
5 5 2 8 9

ပထမကော်လံရှိ ပျမ်းမျှတန်ဖိုးသည် 4 ဖြစ်ပြီး၊ ထို့ကြောင့် ပထမကော်လံရှိ ပျောက်ဆုံးတန်ဖိုးများကို 4 ဖြင့် အစားထိုးထားသည်။

အောက်ပါကုဒ်သည် ကော်လံတစ်ခုစီရှိ ပျောက်ဆုံးနေသောတန်ဖိုးများကို ၎င်း၏ကိုယ်ပိုင်ကော်လံ၏ အလယ်အလတ်ဖြင့် အစားထိုးနည်းကို ပြသသည်-

 #create data frame
df <- data.frame(var1=c(1, NA, NA, 4, 5),
                 var2=c(7, 7, 8, NA, 2),
                 var3=c(NA, 3, 6, NA, 8),
                 var4=c(1, 1, 2, 8, 9))

#replace missing values in each column with column medians
for(i in 1: ncol (df)) {
  df[ , i][ is.na (df[ , i])] <- median(df[ , i], na.rm = TRUE )
}

#view data frame with missing values replaced
df

  var1 var2 var3 var4
1 1 7 6 1
2 4 7 3 1
3 4 8 6 2
4 4 7 6 8
5 5 2 8 9

ထပ်လောင်းအရင်းအမြစ်များ

R တွင် ကော်လံအမည်များကို မည်သို့ပြန်ဆိုရမည်နည်း။
R တွင် ကော်လံအများအပြား၏ ပျမ်းမျှအား တွက်ချက်နည်း
R တွင် သီးခြားကော်လံများကို ပေါင်းနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်