Pandas- dropna() ကို ခြွေကွင်းဖြင့် ဘယ်လိုသုံးမလဲ။
ပျောက်ဆုံးနေသောတန်ဖိုးများပါရှိသော pandas DataFrame မှအတန်းများကိုဖယ်ရှားရန် dropna() လုပ်ဆောင်ချက်ကိုသင်အသုံးပြုနိုင်သည်။
DataFrame တွင် အတန်းတစ်ခု သို့မဟုတ် ကော်လံတစ်ခုအား ထိန်းသိမ်းထားရန်လိုအပ်သည့် အနည်းဆုံး NaN မဟုတ်သည့်တန်ဖိုးများ အရေအတွက်ကို သတ်မှတ်ရန် thresh argument ကို အသုံးပြုနိုင်သည်။
ဤသည်မှာ တံခါးခုံ အငြင်းအခုံကို လက်တွေ့တွင် အသုံးပြုရန် အသုံးအများဆုံးနည်းလမ်းများဖြစ်သည်-
နည်းလမ်း 1- NaN မဟုတ်သော တန်ဖိုး အနည်းဆုံး အရေအတွက်ဖြင့် အတန်းများကိုသာ ထားရှိပါ။
#only keep rows with at least 2 non-NaN values df. dropna (thresh= 2 )
နည်းလမ်း 2- NaN မဟုတ်သော တန်ဖိုးများ၏ အနည်းဆုံး ရာခိုင်နှုန်းဖြင့် အတန်းများကိုသာ ထားရှိပါ။
#only keep rows with at least 70% non-NaN values df. dropna (thresh= 0.7 * len (df. columns ))
နည်းလမ်း 3- NaN မဟုတ်သော တန်ဖိုးအနည်းဆုံး အရေအတွက်ဖြင့် ကော်လံများကိုသာ သိမ်းဆည်းပါ။
#only keep columns with at least 6 non-NaN values df. dropna (thresh= 6 ,axis= 1 )
နည်းလမ်း 4- NaN မဟုတ်သော တန်ဖိုးများ၏ အနည်းဆုံး ရာခိုင်နှုန်းဖြင့် ကော်လံများကိုသာ သိမ်းဆည်းပါ။
#only keep columns with at least 70% non-NaN values df. dropna (thresh= 0.7 * len (df), axis= 1 )
အောက်ဖော်ပြပါနမူနာများသည် အောက်ပါ pandas DataFrame ဖြင့် လက်တွေ့တွင် နည်းလမ်းတစ်ခုစီကို အသုံးပြုနည်းကို ပြသသည်-
import pandas as pd import numpy as np #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, np.nan, 19, 14, 14, 11, 20, np.nan], ' assists ': [5, np.nan, np.nan, 9, np.nan, 9, 9, 4], ' rebounds ': [11, np.nan, 10, 6, 6, 5, 9, np.nan]}) #view DataFrame print (df) team points assists rebounds 0 A 18.0 5.0 11.0 1 B NaN NaN NaN 2 C 19.0 NaN 10.0 3D 14.0 9.0 6.0 4 E 14.0 NaN 6.0 5 F 11.0 9.0 5.0 6G 20.0 9.0 9.0 7H NaN 4.0 NaN
ဥပမာ 1- NaN မဟုတ်သော တန်ဖိုး အနည်းဆုံး အရေအတွက်ဖြင့် အတန်းများကိုသာ ထားရှိပါ။
NaN မဟုတ်သော တန်ဖိုး အနည်းဆုံး 2 ခုရှိသည့် DataFrame တွင် အတန်းများကိုသာထားရှိရန် အောက်ပါအထားအသိုကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-
#only keep rows with at least 2 non-NaN values df. dropna (thresh= 2 ) team points assists rebounds 0 A 18.0 5.0 11.0 2 C 19.0 NaN 10.0 3D 14.0 9.0 6.0 4 E 14.0 NaN 6.0 5 F 11.0 9.0 5.0 6G 20.0 9.0 9.0 7H NaN 4.0 NaN
အတန်းတစ်ခုလုံးတွင် NaN မဟုတ်သောတန်ဖိုးတစ်ခုသာရှိသောကြောင့် အညွှန်းနေရာ 1 ရှိ အတန်းအား ဖယ်ရှားလိုက်ကြောင်း သတိပြုပါ။
ဥပမာ 2- NaN မဟုတ်သော တန်ဖိုးများ၏ အနည်းဆုံး ရာခိုင်နှုန်းဖြင့် အတန်းများကိုသာ ထားရှိပါ။
အနည်းဆုံး 70% Non-NaN တန်ဖိုးများပါရှိသော DataFrame တွင် ထိုအတန်းများကိုသာ ထားရှိရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။
#only keep rows with at least 70% non-NaN values df. dropna (thresh= 0.7 * len (df. columns )) team points assists rebounds 0 A 18.0 5.0 11.0 2 C 19.0 NaN 10.0 3D 14.0 9.0 6.0 4 E 14.0 NaN 6.0 5 F 11.0 9.0 5.0 6G 20.0 9.0 9.0
အညွှန်းရာထူး 1 နှင့် 7 ရှိ အတန်းများကို ဤအတန်းများတွင် NaN မဟုတ်သည့်တန်ဖိုးများအဖြစ် တန်ဖိုးများ၏ အနည်းဆုံး 70% မပါဝင်သောကြောင့် ဖယ်ရှားလိုက်သည်ကို သတိပြုပါ။
ဥပမာ 3- NaN မဟုတ်သော တန်ဖိုးအနည်းဆုံး အရေအတွက်ဖြင့် ကော်လံများကိုသာ သိမ်းဆည်းပါ။
NaN မဟုတ်သော တန်ဖိုး အနည်းဆုံး 6 ခုပါရှိသော DataFrame တွင် ထိုကော်လံများကိုသာ သိမ်းဆည်းရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။
#only keep columns with at least 6 non-NaN values df. dropna (thresh= 6 ,axis= 1 ) team points rebounds 0 A 18.0 11.0 1 B NaN NaN 2 C 19.0 10.0 3D 14.0 6.0 4E 14.0 6.0 5 F 11.0 5.0 6G 20.0 9.0 7 H NaN NaN
ထိုကော်လံတွင် NaN မဟုတ်သော တန်ဖိုး အနည်းဆုံး 6 ခု မပါဝင်သောကြောင့် “ အကူအညီ” ကော်လံကို ဖယ်ရှားခဲ့ကြောင်း သတိပြုပါ။
ဥပမာ 4- NaN မဟုတ်သော တန်ဖိုးများ၏ အနည်းဆုံး ရာခိုင်နှုန်းဖြင့် ကော်လံများကိုသာ သိမ်းဆည်းပါ။
အနည်းဆုံး 70% Non-NaN တန်ဖိုးများပါရှိသော DataFrame တွင် ထိုကော်လံများကိုသာ ထားရှိရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။
#only keep columns with at least 70% non-NaN values df. dropna (thresh= 0.7 * len (df), axis= 1 ) team points rebounds 0 A 18.0 11.0 1 B NaN NaN 2 C 19.0 10.0 3D 14.0 6.0 4E 14.0 6.0 5 F 11.0 5.0 6G 20.0 9.0 7 H NaN NaN
ဤကော်လံတွင် NaN မဟုတ်သော တန်ဖိုး အနည်းဆုံး 70% မပါဝင်သောကြောင့် “ ပံ့ပိုးမှု” ကော်လံကို ဖယ်ရှားလိုက်ကြောင်း သတိပြုပါ။
မှတ်ချက် – pandas dropna() လုပ်ဆောင်ချက်၏ စာရွက်စာတမ်းအပြည့်အစုံကို ဤနေရာတွင် ရှာတွေ့နိုင်ပါသည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ပန်ဒါများတွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
Pandas- dropna() ကိုအသုံးပြုပြီးနောက် အညွှန်းကိန်းပြန်လည်သတ်မှတ်နည်း
Pandas- သီးခြားကော်လံများနှင့်အတူ dropna() ကိုအသုံးပြုနည်း
Pandas- အခြေအနေများစွာအပေါ်အခြေခံ၍ အတန်းများကို ဖျက်နည်း