Pandas- စာကြောင်းတွင် စာကြောင်းခွဲများစွာပါရှိမရှိ စစ်ဆေးပါ။


Pandas DataFrame တွင် စာကြောင်းတစ်ကြောင်းတွင် တန်းခွဲများစွာပါရှိမရှိ စစ်ဆေးရန် အောက်ပါနည်းလမ်းများကို သင်အသုံးပြုနိုင်ပါသည်။

နည်းလမ်း ၁

 df[' string_column ']. str . contains (' | ' .join ([' string1 ',' string2 ']))

နည်းလမ်း 2- စာကြောင်းတွင် စာကြောင်းခွဲများစွာပါရှိမရှိ စစ်ဆေးပါ။

 df[' string_column ']. str . contains ( r'^(?=.*string1)(?=.*string2)' )

အောက်ဖော်ပြပါနမူနာများသည် အောက်ပါ pandas DataFrame ဖြင့် လက်တွေ့တွင် နည်းလမ်းတစ်ခုစီကို အသုံးပြုနည်းကို ပြသသည်-

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Good East Team', 'Good West Team', 'Great East Team',
                             'Great West Team', 'Bad East Team', 'Bad West Team'],
                   ' points ': [93, 99, 105, 110, 85, 88]})

#view DataFrame
print (df)

              team points
0 Good East Team 93
1 Good West Team 99
2 Great East Team 105
3 Great West Team 110
4 Bad East Team 85
5 Bad West Team 88

ဥပမာ 1- string တွင် substrings များစွာထဲမှ တစ်ခု ပါဝင်ခြင်း ရှိ၊ မရှိ စစ်ဆေးပါ။

အဖွဲ့ ကော်လံရှိ စာကြောင်းတစ်ခုစီတွင် “ Good” သို့မဟုတ် “ Is” ခွဲစာတန်းများ ပါဝင်ခြင်းရှိမရှိ စစ်ဆေးရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။

 #create new column that checks if each team name contains 'Good' or 'East'
df[' good_or_east '] = df[' team ']. str . contains (' | ' .join ([' Good ',' East ']))

#view updated DataFrame
print (df)

              team points good_or_east
0 Good East Team 93 True
1 Good West Team 99 True
2 Great East Team 105 True
3 Great West Team 110 False
4 Bad East Team 85 True
5 Bad West Team 88 False

good_or_east ကော်လံအသစ်သည် အောက်ပါတန်ဖိုးများကို ပြန်ပေးသည်-

  • အဖွဲ့တွင် “ ကောင်းသည်” သို့မဟုတ် “ ရှိ” ပါလျှင် မှန်သည်
  • အဖွဲ့တွင် “ ကောင်း” သို့မဟုတ် “ ရှိ” နှစ်ခုလုံးမပါဝင်ပါက မှားသည်

မှတ်ချက် : | အော်ပရေတာသည် ပန်ဒါတွင် “ သို့မဟုတ်” ဟု အဓိပ္ပာယ်ရသည်။

ဥပမာ 2 : စာကြောင်းတွင် စာကြောင်းခွဲများစွာပါရှိမရှိ စစ်ဆေးပါ။

အဖွဲ့ ကော်လံရှိ စာကြောင်းတစ်ကြောင်းစီတွင် “Good” နှင့် “Is” ဟူသော စာကြောင်းခွဲများ ပါဝင်ခြင်းရှိမရှိ စစ်ဆေးရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။

 #create new column that checks if each team name contains 'Good' and 'East'
df[' good_and_east '] = df[' team ']. str . contains ( r'^(?=.*Good)(?=.*East)' )

#view updated DataFrame
print (df)

              team points good_and_east
0 Good East Team 93 True
1 Good West Team 99 False
2 Great East Team 105 False
3 Great West Team 110 False
4 Bad East Team 85 False
5 Bad West Team 88 False

ကော်လံအသစ် good_and_east သည် အောက်ပါတန်ဖိုးများကို ပြန်ပေးသည်-

  • အဖွဲ့တွင် “ ကောင်း” နှင့် “ ရှိ” ပါလျှင် မှန်ပါသည်၊
  • အဖွဲ့တွင် “ ကောင်း” နှင့် “ ရှိ” မပါဝင်ပါက မှားသည်

“ Good” substring နှင့် “ East” substring တို့ပါရှိသော အဖွဲ့အမည်တစ်ခုသာ ပါရှိသောကြောင့် True value တစ်ခုသာ ပြန်ရကြောင်း သတိပြုပါ။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ပန်ဒါများတွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

Pandas- DataFrame တစ်ခုမှ နောက်တစ်ခုသို့ ကော်လံတစ်ခုကို ထည့်ပါ။
Pandas- အခြား DataFrame တွင် မရှိသော အတန်းများကို ရယူပါ။
Pandas- ကော်လံများစွာသည် တူညီမှုရှိမရှိ စစ်ဆေးနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်