Pandas ရှိ nan တန်ဖိုးများဖြင့် အတန်းများကို ဖျက်နည်း


ပန်ဒါ DataFrame တွင် NaN တန်ဖိုးများပါရှိသော အတန်းများကို မကြာခဏ ဖယ်ရှားလိုပေမည်။ ကံကောင်းစွာဖြင့်၊ ၎င်းသည် pandas dropna() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ လုပ်ဆောင်ရန် လွယ်ကူသည်။

ဤသင်ခန်းစာတွင် အောက်ပါ pandas DataFrame တွင် ဤလုပ်ဆောင်ချက်ကို အသုံးပြုခြင်း၏ ဥပမာများစွာကို ပြသသည် ။

 import numpy as np
import scipy.stats as stats

#create DataFrame with some NaN values
df = pd.DataFrame({'rating': [np.nan, 85, np.nan, 88, 94, 90, 76, 75, 87, 86],
                   'points': [np.nan, 25, 14, 16, 27, 20, 12, 15, 14, 19],
                   'assists': [5, 7, 7, np.nan, 5, 7, 6, 9, 9, 5],
                   'rebounds': [11, 8, 10, 6, 6, 9, 6, 10, 10, 7]})

#view DataFrame
df


        rating points assists rebounds
0 NaN NaN 5.0 11
1 85.0 25.0 7.0 8
2 NaN 14.0 7.0 10
3 88.0 16.0 NaN 6
4 94.0 27.0 5.0 6
5 90.0 20.0 7.0 9
6 76.0 12.0 6.0 6
7 75.0 15.0 9.0 10
8 87.0 14.0 9.0 10
9 86.0 19.0 5.0 7

ဥပမာ 1- NaN တန်ဖိုးများဖြင့် အတန်းများကို ဖျက်ပါ။

NaN တန်ဖိုးများ ပါရှိသော အတန်းအားလုံးကို ဖယ်ရှားရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။

 df. dropna ()

	rating points assists rebounds
1 85.0 25.0 7.0 8
4 94.0 27.0 5.0 6
5 90.0 20.0 7.0 9
6 76.0 12.0 6.0 6
7 75.0 15.0 9.0 10
8 87.0 14.0 9.0 10
9 86.0 19.0 5.0 7

ဥပမာ 2- NaN တန်ဖိုးများအားလုံးပါသော အတန်းများကို ဖယ်ရှားပါ။

ကော်လံတစ်ခုစီရှိ NaN တန်ဖိုးများပါရှိသော အတန်း အားလုံးကို ဖယ်ရှားရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။

 df. dropna (how=' all ') 

        rating points assists rebounds
0 NaN NaN 5.0 11
1 85.0 25.0 7.0 8
2 NaN 14.0 7.0 10
3 88.0 16.0 NaN 6
4 94.0 27.0 5.0 6
5 90.0 20.0 7.0 9
6 76.0 12.0 6.0 6
7 75.0 15.0 9.0 10
8 87.0 14.0 9.0 10
9 86.0 19.0 5.0 7

ဤအထူးသဖြင့် DataFrame တွင် NaN တန်ဖိုးများအားလုံးပါသည့် အတန်းမရှိသောကြောင့် အတန်းများကို ဖျက်မထားပါ။

ဥပမာ 3- သတ်မှတ်ထားသော အဆင့်တစ်ခုအောက်ရှိ အတန်းများကို ဖျက်ပါ။

NaN မဟုတ်သော တန်ဖိုးများ အနည်းဆုံး အရေအတွက်အချို့ မရှိသော အတန်းအားလုံးကို ဖယ်ရှားရန် အောက်ပါ syntax ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်ပါသည်။

 df. dropna (thresh= 3 ) 

	rating points assists rebounds
1 85.0 25.0 7.0 8
2 NaN 14.0 7.0 10
3 88.0 16.0 NaN 6
4 94.0 27.0 5.0 6
5 90.0 20.0 7.0 9
6 76.0 12.0 6.0 6
7 75.0 15.0 9.0 10
8 87.0 14.0 9.0 10
9 86.0 19.0 5.0 7

မူရင်း DataFrame ၏ ပထမအတန်းတွင် NaN မဟုတ်သော တန်ဖိုး အနည်းဆုံး 3 ခု မပါဝင်သောကြောင့် ၎င်းကို ဖယ်ရှားလိုက်သော တစ်ခုတည်းသောအတန်းဖြစ်သည်။

ဥပမာ 4- သီးခြားကော်လံတစ်ခုရှိ Nan တန်ဖိုးများပါသည့် အတန်းကို ဖျက်ပါ။

သီးခြားကော်လံတစ်ခုရှိ NaN တန်ဖိုးရှိသော အတန်းအားလုံးကို ဖယ်ရှားရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။

 df. dropna (subset=[' assists '])

	rating points assists rebounds
0 NaN NaN 5.0 11
1 85.0 25.0 7.0 8
2 NaN 14.0 7.0 10
4 94.0 27.0 5.0 6
5 90.0 20.0 7.0 9
6 76.0 12.0 6.0 6
7 75.0 15.0 9.0 10
8 87.0 14.0 9.0 10
9 86.0 19.0 5.0 7

ဥပမာ 5- NaNs ဖြင့် အတန်းများကို ဖျက်ပြီးနောက် အညွှန်းကို ပြန်လည်သတ်မှတ်ပါ။

NaN တန်ဖိုးများဖြင့် အတန်းများကို ဖျက်ပြီးနောက် DataFrame ၏ အညွှန်းကို ပြန်လည်သတ်မှတ်ရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။

 #drop all rows that have any NaN values
df = df. dropna ()

#reset index of DataFrame
df = df. reset_index (drop=True)

#view DataFrame
df

        rating points assists rebounds
0 85.0 25.0 7.0 8
1 94.0 27.0 5.0 6
2 90.0 20.0 7.0 9
3 76.0 12.0 6.0 6
4 75.0 15.0 9.0 10
5 87.0 14.0 9.0 10
6 86.0 19.0 5.0 77

dropna() လုပ်ဆောင်ချက်အတွက် စာရွက်စာတမ်းအပြည့်အစုံကို ဤနေရာတွင် ရှာတွေ့နိုင်ပါသည်။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်