Pandas- အုပ်စုအလိုက် describe() အသုံးပြုပုံ


pandas DataFrame အတွင်းရှိ variable များအတွက် descriptive statistics ကိုဖန်တီးရန် describe() လုပ်ဆောင်ချက်ကို သင်အသုံးပြုနိုင်ပါသည်။

ပန်ဒါရှိ groupby() လုပ်ဆောင်ချက်ဖြင့် describe() လုပ်ဆောင်ချက်ကို အသုံးပြုရန် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်-

 df. groupby (' group_var ')[' values_var ']. describe ()

အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။

ဥပမာ- Pandas ရှိ အဖွဲ့မှ describe() ကိုသုံးပါ။

ကျွန်ုပ်တို့တွင် မတူညီသောအသင်းနှစ်သင်းမှ ဘတ်စကတ်ဘောကစားသမားများအကြောင်း အချက်အလက်ပါရှိသော အောက်ပါပန်ဒါ DataFrame ရှိသည်ဆိုပါစို့။

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [8, 12, 14, 14, 15, 22, 27, 24],
                   ' assists ':[2, 2, 3, 5, 7, 6, 8, 12]})

#view DataFrame
print (df)

  team points assists
0 to 8 2
1 to 12 2
2 to 14 3
3 to 14 5
4 B 15 7
5 B 22 6
6 B 27 8
7 B 24 12

အဖွဲ့ တစ်ခုစီအတွက် အမှတ်များ ကော်လံရှိ တန်ဖိုးများကို အကျဉ်းချုပ်ရန် groupby() လုပ်ဆောင်ချက်ဖြင့် describe() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။

 #summarize points by team
df. groupby (' team ')[' points ']. describe ()

count mean std min 25% 50% 75% max
team								
A 4.0 12.0 2.828427 8.0 11.00 13.0 14.00 14.0
B 4.0 22.0 5.099020 15.0 20.25 23.0 24.75 27.0

ရလဒ်မှ အသင်းတစ်သင်းချင်းစီအတွက် အမှတ်များ ပြောင်းလဲနိုင်သော အောက်ပါတန်ဖိုးများကို ကျွန်ုပ်တို့ မြင်တွေ့နိုင်သည်-

  • count (ကြည့်ရှုမှုအရေအတွက်)
  • ပျမ်းမျှ (ပျမ်းမျှအမှတ်တန်ဖိုး)
  • std (အမှတ်တန်ဖိုးများ၏ စံသွေဖည်မှု)
  • အနည်းဆုံး (အနည်းဆုံး အမှတ်တန်ဖိုး)
  • 25 % (အမှတ်၏ 25th ရာခိုင်နှုန်း)
  • 50 % (အမှတ်၏ 50th ရာခိုင်နှုန်း (ဆိုလိုသည်မှာ အလယ်အလတ်))
  • 75 % (အမှတ်၏ 75th ရာခိုင်နှုန်း)
  • အမြင့်ဆုံး (အမှတ်အများဆုံးတန်ဖိုး)

ရလဒ်များကို DataFrame ဖော်မတ်ဖြင့် ပြသလိုပါက၊ reset_index() အကြောင်းပြချက်ကို အသုံးပြုနိုင်ပါသည်။

 #summarize points by team
df. groupby (' team ')[' points ']. describe (). reset_index ()

        team count mean std min 25% 50% 75% max
0 A 4.0 12.0 2.828427 8.0 11.00 13.0 14.00 14.0
1 B 4.0 22.0 5.099020 15.0 20.25 23.0 24.75 27.0

team variable သည် ယခုအခါ DataFrame ရှိ ကော်လံတစ်ခုဖြစ်ပြီး အညွှန်းတန်ဖိုးများသည် 0 နှင့် 1 ဖြစ်သည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ပန်ဒါများတွင် အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

Pandas- အုပ်စုတစ်ခုစီအတွက် စုဆောင်းငွေကို တွက်ချက်နည်း
Pandas- အုပ်စုအလိုက် ထူးခြားသောတန်ဖိုးများကို ရေတွက်နည်း
Pandas- အုပ်စုအလိုက် ဆက်စပ်မှုကို တွက်ချက်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်