Pandas- ကော်လံအများအပြားရှိ ထပ်တူများကို ဖယ်ရှားနည်း
Pandas DataFrame အတွင်းရှိ ကော်လံအများအပြားရှိ ကော်လံအများအပြားတွင် ပွားနေသောအတန်းများကို ဖယ်ရှားရန် အောက်ပါနည်းလမ်းများကို အသုံးပြုနိုင်ပါသည်။
နည်းလမ်း 1- ကော်လံအားလုံးရှိ ထပ်တူများကို ဖယ်ရှားပါ။
df. drop_duplicates ()
နည်းလမ်း 2- သီးခြားကော်လံများတွင် ထပ်နေသောများကို ဖယ်ရှားပါ။
df. drop_duplicates ([' column1 ',' column3 '])
အောက်ဖော်ပြပါနမူနာများသည် အောက်ပါ pandas DataFrame ဖြင့် လက်တွေ့တွင် နည်းလမ်းတစ်ခုစီကို အသုံးပြုနည်းကို ပြသသည်-
import pandas as pd #createDataFrame df = pd. DataFrame ({' region ': ['East', 'East', 'East', 'West', 'West', 'West'], ' store ': [1, 1, 2, 1, 2, 2], ' sales ': [5, 5, 7, 9, 12, 8]}) #view DataFrame print (df) region store sales 0 East 1 5 1 East 1 5 2 East 2 7 3 West 1 9 4 West 2 12 5 West 2 8
ဥပမာ 1- ကော်လံအားလုံးရှိ ထပ်တူများကို ဖယ်ရှားပါ။
အောက်ပါကုဒ်သည် ကော်လံအားလုံးတွင် ထပ်နေသောတန်ဖိုးများနှင့် အတန်းများကို ဖယ်ရှားနည်းကို ပြသသည်-
#drop rows that have duplicate values across all columns
df. drop_duplicates ()
region store sales
0 East 1 5
2 East 2 7
3 West 1 9
4 West 2 12
5 West 2 8
အညွှန်းနေရာ 1 ရှိ အတန်းသည် အညွှန်းကိန်း အနေအထား 0 ရှိ အတန်းကဲ့သို့ ကော်လံအားလုံးတွင် တူညီသောတန်ဖိုးများ ရှိနေသောကြောင့် ၎င်းကို DataFrame မှ ဖယ်ရှားခဲ့သည်။
မူရင်းအားဖြင့်၊ ပန်ဒါများသည် ပထမစာကြောင်းကို ထပ်နေပါသည်။ သို့သော်၊ နောက်ဆုံး ထပ်နေသောမျဉ်းကို ဆက်လက်ထားရှိရန် သတ်မှတ်ရန် keep argument ကို အသုံးပြုနိုင်သည်။
#drop rows that have duplicate values across all columns (keep last duplicate)
df. drop_duplicates (keep=' last ')
region store sales
1 East 1 5
2 East 2 7
3 West 1 9
4 West 2 12
5 West 2 8
ဥပမာ 2- သီးခြားကော်လံများတွင် ထပ်နေသောများကို ဖယ်ရှားပါ။
ဒေသတွင်း ၌သာ ထပ်နေသောတန်ဖိုးများပါရှိသော အတန်းများကို ဖယ်ရှားရန်နှင့် ကော်လံများကို သိမ်းဆည်း ရန် အောက်ပါကုဒ်ကို သင်အသုံးပြုနိုင်သည်-
#drop rows that have duplicate values across region and store columns
df. drop_duplicates ([' region ',' store '])
region store sales
0 East 1 5
2 East 2 7
3 West 1 9
4 West 2 12
စုစုပေါင်း၊ အတန်းနှစ်တန်းကို Region နှင့် Store ကော်လံများတွင် ထပ်တူတန်ဖိုးများပါရှိသောကြောင့် DataFrame မှဖယ်ရှားခဲ့သည်။
မှတ်ချက် – drop_duplicates() လုပ်ဆောင်ချက်အတွက် စာရွက်စာတမ်းအပြည့်အစုံကို ဤနေရာတွင် ရှာဖွေနိုင်ပါသည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ပန်ဒါများတွင် အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
ပန်ဒါများတွင် ထပ်နေသည့်ပုံများကို မည်သို့ရှာရမည်နည်း။
Pandas ရှိ ထပ်နေသောကော်လံများကို ဖယ်ရှားနည်း
Pandas DataFrame ရှိ ပထမတန်းကို ဖယ်ရှားနည်း