A: ကော်လံတစ်ခုစီရှိ na တန်ဖိုးများ အရေအတွက်ကို ရေတွက်ပါ။
R ရှိ ဒေတာဘောင်တစ်ခုစီရှိ ကော်လံတစ်ခုစီရှိ NA တန်ဖိုးများကို ရေတွက်ရန် အောက်ပါနည်းလမ်းများကို သင်သုံးနိုင်သည်။
Method 1: base R ကိုသုံးပြီး ကော်လံတစ်ခုစီရှိ NA တန်ဖိုးများကို ရေတွက်ပါ။
sapply(df, function (x) sum(is. na (x)))
နည်းလမ်း 2- dplyr ကို အသုံးပြု၍ ကော်လံတစ်ခုစီရှိ NA တန်ဖိုးများကို ရေတွက်ပါ။
library (dplyr) df %>% summarise(across(everything(), ~ sum(is. na (.))))
အောက်ပါဥပမာများသည် R ရှိ အောက်ပါဒေတာဘောင်ဖြင့် နည်းလမ်းတစ်ခုစီကို အသုံးပြုနည်းကို ပြသသည်-
#create data frame df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'), points=c(99, 90, 86, 88, NA), assists=c(33, NA, NA, 39, 34), rebounds=c(30, 28, 24, 24, 28)) #view data frame df team points assists rebounds 1 A 99 33 30 2 B 90 NA 28 3 C 86 NA 24 4 D 88 39 24 5 E NA 34 28
ဥပမာ 1- အခြေခံ R ကို အသုံးပြု၍ ကော်လံတစ်ခုစီရှိ NA တန်ဖိုးများကို ရေတွက်ပါ။
အောက်ပါကုဒ်သည် R base sapply() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ ကော်လံတစ်ခုစီရှိ NA တန်ဖိုးများ ရေတွက်နည်းကို ပြသသည်-
#count NA values in each column sapply(df, function (x) sum(is. na (x))) team points assists rebounds 0 1 2 0
ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-
- အဖွဲ့ ကော်လံတွင် 0 NA တန်ဖိုးများ ရှိသည်။
- အမှတ်များ ကော်လံတွင် 1 NA တန်ဖိုးရှိသည်။
- အကူအညီ ကော်လံတွင် NA တန်ဖိုး ၂ ခု ရှိသည်။
- ပြန်ပြောင်း ကော်လံတွင် 0 NA တန်ဖိုးများရှိသည်။
မှတ်ချက် – ဒေတာဘောင်ရှိ ကော်လံတစ်ခုစီတွင် လုပ်ဆောင်ချက်တစ်ခုကို အသုံးချရန် sapply() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။ ဤဥပမာတွင်၊ ကျွန်ုပ်တို့သည် NA နှင့်ညီသောဒြပ်စင်စုစုပေါင်းအရေအတွက်ကိုရေတွက်သည့်လုပ်ဆောင်ချက်ကိုအသုံးပြုသည်။
ဥပမာ 2- dplyr ကို အသုံးပြု၍ ကော်လံတစ်ခုစီရှိ NA တန်ဖိုးများကို ရေတွက်ပါ။
အောက်ပါကုဒ်သည် dplyr ပက်ကေ့ဂျ်မှ summarise() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ ကော်လံတစ်ခုစီရှိ NA တန်ဖိုးများ၏ အရေအတွက်ကို ရေတွက်နည်းကို ပြသသည်-
#count NA values in each column sapply(df, function (x) sum(is. na (x))) team points assists rebounds 0 1 2 0
ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-
- အဖွဲ့ ကော်လံတွင် 0 NA တန်ဖိုးများ ရှိသည်။
- အမှတ်များ ကော်လံတွင် 1 NA တန်ဖိုးရှိသည်။
- အကူအညီ ကော်လံတွင် NA တန်ဖိုး ၂ ခု ရှိသည်။
- ပြန်ပြောင်း ကော်လံတွင် 0 NA တန်ဖိုးများရှိသည်။
ဤရလဒ်များသည် ယခင်ဥပမာများနှင့် ကိုက်ညီပါသည်။
မှတ်ချက် – အလွန်ကြီးမားသောဒေတာဘောင်များနှင့် အလုပ်လုပ်သောအခါ dplyr နည်းလမ်းသည် အခြေခံ R နည်းလမ်းထက် ပိုမြန်ပါသည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
R တွင် na.omit ကိုအသုံးပြုနည်း
R တွင် Complete.cases ကိုအသုံးပြုနည်း
R ရှိ ဒေတာဘောင်မှ ဗလာလိုင်းများကို မည်ကဲ့သို့ ဖယ်ရှားနည်း