Pandas- အမျိုးအစားအလိုက် ကိန်းရှင်များအတွက် describe() ကို မည်သို့အသုံးပြုရမည်နည်း။
ပုံမှန်အားဖြင့်၊ ပန်ဒါရှိ describe() လုပ်ဆောင်ချက်သည် DataFrame ရှိ ကိန်းဂဏာန်းကိန်းရှင်အားလုံးအတွက် ဖော်ပြချက်ကိန်းဂဏန်းများကို တွက်ချက်ပေးပါသည်။
သို့သော်၊ အမျိုးအစားခွဲကိန်းရှင်များ အတွက် ဖော်ပြချက်ကိန်းဂဏန်းများကို တွက်ချက်ရန် အောက်ပါနည်းလမ်းများကို သင်အသုံးပြုနိုင်သည်။
နည်းလမ်း 1- အမျိုးအစားအလိုက် ကိန်းရှင်များအတွက် သရုပ်ဖော်ကိန်းဂဏန်းများကို တွက်ချက်ပါ။
df. describe (include=' object ')
ဤနည်းလမ်းသည် DataFrame တစ်ခုရှိ အမျိုးအစားအလိုက် ကိန်းရှင်တစ်ခုစီအတွက် အရေအတွက် ၊ ထူးခြားသော ၊ ထိပ်တန်း နှင့် ကြိမ်နှုန်းများ ကို တွက်ချက်ပေးမည်ဖြစ်သည်။
နည်းလမ်း 2- ကိန်းရှင်အားလုံးအတွက် အမျိုးအစားအလိုက် ဖော်ပြချက်ဆိုင်ရာ ကိန်းဂဏန်းများကို တွက်ချက်ပါ။
df. astype (' object '). describe ()
ဤနည်းလမ်းသည် DataFrame အတွင်းရှိ variable တစ်ခုစီအတွက် count ၊ unique ၊ top နှင့် freq တို့ကို တွက်ချက်ပေးမည်ဖြစ်ပါသည်။
အောက်ဖော်ပြပါနမူနာများသည် ဘတ်စကတ်ဘောကစားသမားများအကြောင်း အချက်အလက်များစွာပါရှိသော အောက်ပါပန်ဒါ DataFrame ဖြင့် နည်းလမ်းတစ်ခုစီကို အသုံးပြုပုံကို ပြသသည် –
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
' points ': [18, 22, 19, 14, 14, 11, 20, 28],
' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
#view DataFrame
print (df)
team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12
ဥပမာ 1- အမျိုးအစားအလိုက် ကိန်းရှင်များအတွက် သရုပ်ဖော်ကိန်းဂဏန်းများကို တွက်ချက်ပါ။
DataFrame ရှိ အမျိုးအစားခွဲကွဲပြားသည့်ကိန်းရှင်တစ်ခုစီအတွက် ဖော်ပြချက်ကိန်းဂဏန်းများကို တွက်ချက်ရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။
#calculate descriptive statistics for categorical variables only
df. describe (include=' object ')
team
count 8
single 8
top A
freq 1
အထွက်သည် DataFrame ရှိ အမျိုးအစားခွဲကွဲပြားသော ကိန်းရှင် ( အဖွဲ့ ) အတွက် အမျိုးမျိုးသော သရုပ်ဖော်ကိန်းဂဏန်းများကို ပြသသည်။
ဤသည်မှာ ရလဒ်ကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်-
- count : အဖွဲ့ကော်လံတွင် တန်ဖိုး 8 ခု ရှိပါသည်။
- ထူးခြားသော : အဖွဲ့ကော်လံတွင် ထူးခြားသောတန်ဖိုး 8 ခုရှိသည်။
- top : “ top” value (ဆိုလိုသည်မှာ အက္ခရာထဲတွင် အမြင့်ဆုံး) မှာ A ဖြစ်သည်။
- ကြိမ်နှုန်း – ဤအမြင့်ဆုံးတန်ဖိုးသည် 1 ကြိမ် ပေါ်လာသည်။
ဥပမာ 2- ကိန်းရှင်အားလုံးအတွက် အမျိုးအစားအလိုက် ဖော်ပြချက်ဆိုင်ရာ ကိန်းဂဏန်းများကို တွက်ချက်ပါ။
DataFrame အတွင်းရှိ variable တစ်ခုစီအတွက် count ၊ unique ၊ top နှင့် freq ကို တွက်ချက်ရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။
#calculate categorical descriptive statistics for all variables df. astype (' object '). describe () team points assists rebounds count 8 8 8 8 single 8 7 5 7 top A 14 9 6 freq 1 2 3 2
အထွက်သည် ကိန်းဂဏာန်းကိန်းရှင်များအပါအဝင် DataFrame ရှိ variable တစ်ခုစီအတွက် count ၊ unique ၊ top နှင့် freq တို့ကို ပြသသည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ပန်ဒါများတွင် အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
Pandas- အုပ်စုအလိုက် describe() အသုံးပြုပုံ
Pandas- သတ်မှတ်ထားသော ရာခိုင်နှုန်းများနှင့်အတူ describe() ကို မည်သို့အသုံးပြုရမည်နည်း။
Pandas- describe() ကို အသုံးပြုနည်းနှင့် သိပ္ပံဆိုင်ရာ အမှတ်အသားများကို ဖယ်ရှားနည်း