R တွင် listwise delete လုပ်နည်း (ဥပမာဖြင့်)


Listwise ဖျက်ခြင်း သည် ကော်လံ တစ်ခု ရှိ လွဲမှားနေသောတန်ဖိုးရှိသော ဒေတာဘောင်ရှိ အတန်းအားလုံးကို ဖျက်သည့်နည်းလမ်းဖြစ်သည်။

R တွင် listwise ဖျက်ခြင်းကို လုပ်ဆောင်ရန် အလွယ်ဆုံးနည်းလမ်းမှာ အောက်ပါ syntax ကို အသုံးပြုခြင်းဖြစ်သည် ။

 complete_df <- df[complete. boxes (df), ]

ဤ syntax သည် complete.cases() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ မည်သည့်ကော်လံတွင်မဆို ပျောက်ဆုံးနေသောတန်ဖိုးများမရှိသော မူရင်းဒေတာဘောင်မှ ထိုအတန်းများသာပါရှိသော ဒေတာဘောင်အသစ်တစ်ခုကို ဖန်တီးပါ။

အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။

ဥပမာ- R ဖြင့် စာရင်းအတိုင်း ဖျက်ခြင်းကို လုပ်ဆောင်ပါ။

R တွင် ဘတ်စကက်ဘောကစားသမားများအကြောင်း အချက်အလက်များစွာပါရှိသော အောက်ပါဒေတာဘောင်ရှိသည်ဆိုပါစို့။

 #create data frame
df <- data. frame (rating=c(70, 75, 75, 78, 81, 85, 89, 91, 94, 97),
                 points=c(12, 15, 14, 13, NA, 29, 24, 18, 20, 25),
                 assists=c(9, 5, NA, 5, 7, 8, 11, 12, 13, 11))

#view data frame
df

   rating points assists
1 70 12 9
2 75 15 5
3 75 14 NA
4 78 13 5
5 81 NA 7
6 85 29 8
7 89 24 11
8 91 18 12
9 94 20 13
10 97 25 11

အတန်းနှစ်တန်းတွင် အချို့ကော်လံများတွင် NA တန်ဖိုးများပါရှိကြောင်း သတိပြုပါ။

စာရင်းအလိုက် ဖျက်ခြင်း လုပ်ဆောင်ရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပြီး မည်သည့်ကော်လံတွင် ပျောက်ဆုံးနေသော တန်ဖိုးများမရှိသော အတန်းများကိုသာ သိမ်းဆည်းနိုင်သည်-

 #create new data frame that only contains rows with no missing values
complete_df <- df[complete. boxes (df), ]

#view new data frame
complete_df

   rating points assists
1 70 12 9
2 75 15 5
4 78 13 5
6 85 29 8
7 89 24 11
8 91 18 12
9 94 20 13
10 97 25 11

ဤဒေတာဘောင်အသစ်ရှိ အတန်းတစ်ခုမှ မည်သည့်ကော်လံများတွင် အလွတ်တန်ဖိုးများ မပါရှိသည်ကို သတိပြုပါ။

မူရင်းဒေတာဘောင်ရှိ အတန်းအရေအတွက်မည်မျှရှိသည်ကို ဆုံးဖြတ်ရန် nrow() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ကြောင်း သတိပြုပါ-

 #count how many rows have missing values in any column
nrow(df[ ! complete. cases (df), ])

[1] 2

မူရင်းဒေတာဘောင်ရှိ အတန်း 2 တန်းတွင် အနည်းဆုံး ကော်လံတစ်ခုတွင် တန်ဖိုးများ ပျောက်ဆုံးနေကြောင်း ၎င်းကပြောသည်။

ထို့အပြင် မည်သည့်ကော်လံတွင် ပျောက်ဆုံးနေသောတန်ဖိုးများ မည်မျှရှိသည်ကို အလွယ်တကူ ရေတွက်နိုင်သည်-

 #count how many rows do not have missing values in any column
nrow(df[complete. cases (df), ])

[1] 8

မူရင်းဒေတာဘောင်၏ 8 တန်းတွင် မည်သည့်ကော်လံများတွင် တန်ဖိုးများ ပျောက်ဆုံးနေခြင်းမရှိကြောင်း ၎င်းကပြောသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

R တွင် ပျောက်ဆုံးနေသောတန်ဖိုးများကို ရှာဖွေပြီး ရေတွက်နည်း
R တွင် ပျောက်ဆုံးနေသောတန်ဖိုးများကို ပေါင်းစပ်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်