Pandas- ကော်လံအများအပြားရှိ ထပ်တူများကို ဖယ်ရှားနည်း


Pandas DataFrame အတွင်းရှိ ကော်လံအများအပြားရှိ ကော်လံအများအပြားတွင် ပွားနေသောအတန်းများကို ဖယ်ရှားရန် အောက်ပါနည်းလမ်းများကို အသုံးပြုနိုင်ပါသည်။

နည်းလမ်း 1- ကော်လံအားလုံးရှိ ထပ်တူများကို ဖယ်ရှားပါ။

 df. drop_duplicates ()

နည်းလမ်း 2- သီးခြားကော်လံများတွင် ထပ်နေသောများကို ဖယ်ရှားပါ။

 df. drop_duplicates ([' column1 ',' column3 '])

အောက်ဖော်ပြပါနမူနာများသည် အောက်ပါ pandas DataFrame ဖြင့် လက်တွေ့တွင် နည်းလမ်းတစ်ခုစီကို အသုံးပြုနည်းကို ပြသသည်-

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' region ': ['East', 'East', 'East', 'West', 'West', 'West'],
                   ' store ': [1, 1, 2, 1, 2, 2],
                   ' sales ': [5, 5, 7, 9, 12, 8]})

#view DataFrame
print (df)

  region store sales
0 East 1 5
1 East 1 5
2 East 2 7
3 West 1 9
4 West 2 12
5 West 2 8

ဥပမာ 1- ကော်လံအားလုံးရှိ ထပ်တူများကို ဖယ်ရှားပါ။

အောက်ပါကုဒ်သည် ကော်လံအားလုံးတွင် ထပ်နေသောတန်ဖိုးများနှင့် အတန်းများကို ဖယ်ရှားနည်းကို ပြသသည်-

 #drop rows that have duplicate values across all columns
df. drop_duplicates ()

	region store sales
0 East 1 5
2 East 2 7
3 West 1 9
4 West 2 12
5 West 2 8

အညွှန်းနေရာ 1 ရှိ အတန်းသည် အညွှန်းကိန်း အနေအထား 0 ရှိ အတန်းကဲ့သို့ ကော်လံအားလုံးတွင် တူညီသောတန်ဖိုးများ ရှိနေသောကြောင့် ၎င်းကို DataFrame မှ ဖယ်ရှားခဲ့သည်။

မူရင်းအားဖြင့်၊ ပန်ဒါများသည် ပထမစာကြောင်းကို ထပ်နေပါသည်။ သို့သော်၊ နောက်ဆုံး ထပ်နေသောမျဉ်းကို ဆက်လက်ထားရှိရန် သတ်မှတ်ရန် keep argument ကို အသုံးပြုနိုင်သည်။

 #drop rows that have duplicate values across all columns (keep last duplicate)
df. drop_duplicates (keep=' last ')

	region store sales
1 East 1 5
2 East 2 7
3 West 1 9
4 West 2 12
5 West 2 8

ဥပမာ 2- သီးခြားကော်လံများတွင် ထပ်နေသောများကို ဖယ်ရှားပါ။

ဒေသတွင်း ၌သာ ထပ်နေသောတန်ဖိုးများပါရှိသော အတန်းများကို ဖယ်ရှားရန်နှင့် ကော်လံများကို သိမ်းဆည်း ရန် အောက်ပါကုဒ်ကို သင်အသုံးပြုနိုင်သည်-

 #drop rows that have duplicate values across region and store columns
df. drop_duplicates ([' region ',' store '])

	region store sales
0 East 1 5
2 East 2 7
3 West 1 9
4 West 2 12

စုစုပေါင်း၊ အတန်းနှစ်တန်းကို Region နှင့် Store ကော်လံများတွင် ထပ်တူတန်ဖိုးများပါရှိသောကြောင့် DataFrame မှဖယ်ရှားခဲ့သည်။

မှတ်ချက်drop_duplicates() လုပ်ဆောင်ချက်အတွက် စာရွက်စာတမ်းအပြည့်အစုံကို ဤနေရာတွင် ရှာဖွေနိုင်ပါသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ပန်ဒါများတွင် အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

ပန်ဒါများတွင် ထပ်နေသည့်ပုံများကို မည်သို့ရှာရမည်နည်း။
Pandas ရှိ ထပ်နေသောကော်လံများကို ဖယ်ရှားနည်း
Pandas DataFrame ရှိ ပထမတန်းကို ဖယ်ရှားနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်