ဥပမာများဖြင့် ပန်ဒါများတွင် ထပ်တူများကို ရေတွက်နည်း
Pandas DataFrame တွင် ထပ်နေသောများကို ရေတွက်ရန် အောက်ပါနည်းလမ်းများကို သင်သုံးနိုင်သည်။
နည်းလမ်း 1: ကော်လံတစ်ခုတွင် ထပ်နေသောတန်ဖိုးများကို ရေတွက်ပါ။
len (df[' my_column ']) - len (df[' my_column ']. drop_duplicates ())
နည်းလမ်း 2- ပွားနေသောအတန်းများကို ရေတွက်ပါ။
len (df) -len ( df.drop_duplicates ())
နည်းလမ်း 3- တစ်မူထူးခြားသောအတန်းတစ်ခုစီအတွက် ထပ်တူများကိုရေတွက်ပါ။
df. groupby ( df.columns.tolist (), as_index= False ) . size ()
အောက်ဖော်ပြပါနမူနာများသည် အောက်ပါ pandas DataFrame ဖြင့် လက်တွေ့တွင် နည်းလမ်းတစ်ခုစီကို အသုံးပြုနည်းကို ပြသသည်-
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' position ': ['G', 'G', 'G', 'F', 'G', 'G', 'F', 'F'], ' points ': [5, 5, 8, 10, 5, 7, 10, 10]}) #view DataFrame print (df) team position points 0 AG 5 1 GA 5 2 AG 8 3 AF 10 4 BG 5 5 BG 7 6 BF 10 7 BF 10
ဥပမာ 1- ကော်လံတစ်ခုတွင် ထပ်နေသောတန်ဖိုးများကို ရေတွက်ပါ။
အောက်ဖော်ပြပါ ကုဒ်သည် အမှတ်များ ကော်လံရှိ ထပ်နေသော တန်ဖိုးများ အရေအတွက်ကို ရေတွက်နည်းကို ပြသည်-
#count duplicate values in points column
len (df[' points '])- len (df[' points ']. drop_duplicates ())
4
အမှတ်များ ကော်လံတွင် မိနေသောတန်ဖိုး 4 ခု ရှိကြောင်း ကျွန်ုပ်တို့ တွေ့နိုင်ပါသည်။
ဥပမာ 2- ပွားနေသောအတန်းများကို ရေတွက်ပါ။
အောက်ပါကုဒ်သည် DataFrame တွင် ထပ်နေသော အတန်းအရေအတွက်ကို ရေတွက်နည်းကို ပြသည်-
#count number of duplicate rows
len (df) -len ( df.drop_duplicates ())
2
DataFrame တွင် ပွားနေသော အတန်း 2 ကြောင်းကို ကျွန်ုပ်တို့ တွေ့နိုင်ပါသည်။
ဤထပ်နေသောစာကြောင်း 2 ခုကိုပြသရန် အောက်ပါ syntax ကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-
#display duplicated rows
df[df. duplicated ()]
team position points
1 A G 5
7 B F 10
ဥပမာ 3- တစ်မူထူးခြားသောအတန်းတစ်ခုစီအတွက် ထပ်တူများကိုရေတွက်ပါ။
အောက်ပါကုဒ်သည် DataFrame ရှိ သီးသန့်အတန်းတစ်ခုစီအတွက် ထပ်နေသောအရေအတွက်ကို ရေတွက်နည်းကို ပြသသည်-
#display number of duplicates for each unique row
df. groupby ( df.columns.tolist (), as_index= False ) . size ()
team position points size
0 A F 10 1
1 A G 5 2
2 A G 8 1
3 B F 10 2
4 B G 5 1
5 B G 7 1
အရွယ်အစား ကော်လံသည် တစ်မူထူးခြားသော အတန်းတစ်ခုစီအတွက် ထပ်နေသော အရေအတွက်ကို ပြသသည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ပန်ဒါများတွင် အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
Pandas တွင် ထပ်နေသောအတန်းများကို ဖယ်ရှားနည်း
Pandas ရှိ ထပ်နေသောကော်လံများကို ဖယ်ရှားနည်း
Pandas ရှိ အညွှန်းအလိုက် ကော်လံများကို မည်သို့ရွေးချယ်ရမည်နည်း။