Pandas- အမျိုးအစားအလိုက် ကိန်းရှင်များအတွက် describe() ကို မည်သို့အသုံးပြုရမည်နည်း။


ပုံမှန်အားဖြင့်၊ ပန်ဒါရှိ describe() လုပ်ဆောင်ချက်သည် DataFrame ရှိ ကိန်းဂဏာန်းကိန်းရှင်အားလုံးအတွက် ဖော်ပြချက်ကိန်းဂဏန်းများကို တွက်ချက်ပေးပါသည်။

သို့သော်၊ အမျိုးအစားခွဲကိန်းရှင်များ အတွက် ဖော်ပြချက်ကိန်းဂဏန်းများကို တွက်ချက်ရန် အောက်ပါနည်းလမ်းများကို သင်အသုံးပြုနိုင်သည်။

နည်းလမ်း 1- အမျိုးအစားအလိုက် ကိန်းရှင်များအတွက် သရုပ်ဖော်ကိန်းဂဏန်းများကို တွက်ချက်ပါ။

 df. describe (include=' object ')

ဤနည်းလမ်းသည် DataFrame တစ်ခုရှိ အမျိုးအစားအလိုက် ကိန်းရှင်တစ်ခုစီအတွက် အရေအတွက်ထူးခြားသောထိပ်တန်း နှင့် ကြိမ်နှုန်းများ ကို တွက်ချက်ပေးမည်ဖြစ်သည်။

နည်းလမ်း 2- ကိန်းရှင်အားလုံးအတွက် အမျိုးအစားအလိုက် ဖော်ပြချက်ဆိုင်ရာ ကိန်းဂဏန်းများကို တွက်ချက်ပါ။

 df. astype (' object '). describe ()

ဤနည်းလမ်းသည် DataFrame အတွင်းရှိ variable တစ်ခုစီအတွက် countuniquetop နှင့် freq တို့ကို တွက်ချက်ပေးမည်ဖြစ်ပါသည်။

အောက်ဖော်ပြပါနမူနာများသည် ဘတ်စကတ်ဘောကစားသမားများအကြောင်း အချက်အလက်များစွာပါရှိသော အောက်ပါပန်ဒါ DataFrame ဖြင့် နည်းလမ်းတစ်ခုစီကို အသုံးပြုပုံကို ပြသသည်

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12

ဥပမာ 1- အမျိုးအစားအလိုက် ကိန်းရှင်များအတွက် သရုပ်ဖော်ကိန်းဂဏန်းများကို တွက်ချက်ပါ။

DataFrame ရှိ အမျိုးအစားခွဲကွဲပြားသည့်ကိန်းရှင်တစ်ခုစီအတွက် ဖော်ပြချက်ကိန်းဂဏန်းများကို တွက်ချက်ရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။

 #calculate descriptive statistics for categorical variables only
df. describe (include=' object ')

team
count 8
single 8
top A
freq 1

အထွက်သည် DataFrame ရှိ အမျိုးအစားခွဲကွဲပြားသော ကိန်းရှင် ( အဖွဲ့ ) အတွက် အမျိုးမျိုးသော သရုပ်ဖော်ကိန်းဂဏန်းများကို ပြသသည်။

ဤသည်မှာ ရလဒ်ကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်-

  • count : အဖွဲ့ကော်လံတွင် တန်ဖိုး 8 ခု ရှိပါသည်။
  • ထူးခြားသော : အဖွဲ့ကော်လံတွင် ထူးခြားသောတန်ဖိုး 8 ခုရှိသည်။
  • top : “ top” value (ဆိုလိုသည်မှာ အက္ခရာထဲတွင် အမြင့်ဆုံး) မှာ A ဖြစ်သည်။
  • ကြိမ်နှုန်း – ဤအမြင့်ဆုံးတန်ဖိုးသည် 1 ကြိမ် ပေါ်လာသည်။

ဥပမာ 2- ကိန်းရှင်အားလုံးအတွက် အမျိုးအစားအလိုက် ဖော်ပြချက်ဆိုင်ရာ ကိန်းဂဏန်းများကို တွက်ချက်ပါ။

DataFrame အတွင်းရှိ variable တစ်ခုစီအတွက် countuniquetop နှင့် freq ကို တွက်ချက်ရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။

 #calculate categorical descriptive statistics for all variables
df. astype (' object '). describe ()

        team points assists rebounds
count 8 8 8 8
single 8 7 5 7
top A 14 9 6
freq 1 2 3 2

အထွက်သည် ကိန်းဂဏာန်းကိန်းရှင်များအပါအဝင် DataFrame ရှိ variable တစ်ခုစီအတွက် countuniquetop နှင့် freq တို့ကို ပြသသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ပန်ဒါများတွင် အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

Pandas- အုပ်စုအလိုက် describe() အသုံးပြုပုံ
Pandas- သတ်မှတ်ထားသော ရာခိုင်နှုန်းများနှင့်အတူ describe() ကို မည်သို့အသုံးပြုရမည်နည်း။
Pandas- describe() ကို အသုံးပြုနည်းနှင့် သိပ္ပံဆိုင်ရာ အမှတ်အသားများကို ဖယ်ရှားနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်