Pandas- စာကြောင်းတွင် စာကြောင်းခွဲများစွာပါရှိမရှိ စစ်ဆေးပါ။
Pandas DataFrame တွင် စာကြောင်းတစ်ကြောင်းတွင် တန်းခွဲများစွာပါရှိမရှိ စစ်ဆေးရန် အောက်ပါနည်းလမ်းများကို သင်အသုံးပြုနိုင်ပါသည်။
နည်းလမ်း ၁
df[' string_column ']. str . contains (' | ' .join ([' string1 ',' string2 ']))
နည်းလမ်း 2- စာကြောင်းတွင် စာကြောင်းခွဲများစွာပါရှိမရှိ စစ်ဆေးပါ။
df[' string_column ']. str . contains ( r'^(?=.*string1)(?=.*string2)' )
အောက်ဖော်ပြပါနမူနာများသည် အောက်ပါ pandas DataFrame ဖြင့် လက်တွေ့တွင် နည်းလမ်းတစ်ခုစီကို အသုံးပြုနည်းကို ပြသသည်-
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['Good East Team', 'Good West Team', 'Great East Team',
'Great West Team', 'Bad East Team', 'Bad West Team'],
' points ': [93, 99, 105, 110, 85, 88]})
#view DataFrame
print (df)
team points
0 Good East Team 93
1 Good West Team 99
2 Great East Team 105
3 Great West Team 110
4 Bad East Team 85
5 Bad West Team 88
ဥပမာ 1- string တွင် substrings များစွာထဲမှ တစ်ခု ပါဝင်ခြင်း ရှိ၊ မရှိ စစ်ဆေးပါ။
အဖွဲ့ ကော်လံရှိ စာကြောင်းတစ်ခုစီတွင် “ Good” သို့မဟုတ် “ Is” ခွဲစာတန်းများ ပါဝင်ခြင်းရှိမရှိ စစ်ဆေးရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။
#create new column that checks if each team name contains 'Good' or 'East'
df[' good_or_east '] = df[' team ']. str . contains (' | ' .join ([' Good ',' East ']))
#view updated DataFrame
print (df)
team points good_or_east
0 Good East Team 93 True
1 Good West Team 99 True
2 Great East Team 105 True
3 Great West Team 110 False
4 Bad East Team 85 True
5 Bad West Team 88 False
good_or_east ကော်လံအသစ်သည် အောက်ပါတန်ဖိုးများကို ပြန်ပေးသည်-
- အဖွဲ့တွင် “ ကောင်းသည်” သို့မဟုတ် “ ရှိ” ပါလျှင် မှန်သည်
- အဖွဲ့တွင် “ ကောင်း” သို့မဟုတ် “ ရှိ” နှစ်ခုလုံးမပါဝင်ပါက မှားသည်
မှတ်ချက် : | အော်ပရေတာသည် ပန်ဒါတွင် “ သို့မဟုတ်” ဟု အဓိပ္ပာယ်ရသည်။
ဥပမာ 2 : စာကြောင်းတွင် စာကြောင်းခွဲများစွာပါရှိမရှိ စစ်ဆေးပါ။
အဖွဲ့ ကော်လံရှိ စာကြောင်းတစ်ကြောင်းစီတွင် “Good” နှင့် “Is” ဟူသော စာကြောင်းခွဲများ ပါဝင်ခြင်းရှိမရှိ စစ်ဆေးရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။
#create new column that checks if each team name contains 'Good' and 'East'
df[' good_and_east '] = df[' team ']. str . contains ( r'^(?=.*Good)(?=.*East)' )
#view updated DataFrame
print (df)
team points good_and_east
0 Good East Team 93 True
1 Good West Team 99 False
2 Great East Team 105 False
3 Great West Team 110 False
4 Bad East Team 85 False
5 Bad West Team 88 False
ကော်လံအသစ် good_and_east သည် အောက်ပါတန်ဖိုးများကို ပြန်ပေးသည်-
- အဖွဲ့တွင် “ ကောင်း” နှင့် “ ရှိ” ပါလျှင် မှန်ပါသည်၊
- အဖွဲ့တွင် “ ကောင်း” နှင့် “ ရှိ” မပါဝင်ပါက မှားသည်
“ Good” substring နှင့် “ East” substring တို့ပါရှိသော အဖွဲ့အမည်တစ်ခုသာ ပါရှိသောကြောင့် True value တစ်ခုသာ ပြန်ရကြောင်း သတိပြုပါ။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ပန်ဒါများတွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
Pandas- DataFrame တစ်ခုမှ နောက်တစ်ခုသို့ ကော်လံတစ်ခုကို ထည့်ပါ။
Pandas- အခြား DataFrame တွင် မရှိသော အတန်းများကို ရယူပါ။
Pandas- ကော်လံများစွာသည် တူညီမှုရှိမရှိ စစ်ဆေးနည်း