Pandas- အုပ်စုအလိုက် describe() အသုံးပြုပုံ
pandas DataFrame အတွင်းရှိ variable များအတွက် descriptive statistics ကိုဖန်တီးရန် describe() လုပ်ဆောင်ချက်ကို သင်အသုံးပြုနိုင်ပါသည်။
ပန်ဒါရှိ groupby() လုပ်ဆောင်ချက်ဖြင့် describe() လုပ်ဆောင်ချက်ကို အသုံးပြုရန် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်-
df. groupby (' group_var ')[' values_var ']. describe ()
အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။
ဥပမာ- Pandas ရှိ အဖွဲ့မှ describe() ကိုသုံးပါ။
ကျွန်ုပ်တို့တွင် မတူညီသောအသင်းနှစ်သင်းမှ ဘတ်စကတ်ဘောကစားသမားများအကြောင်း အချက်အလက်ပါရှိသော အောက်ပါပန်ဒါ DataFrame ရှိသည်ဆိုပါစို့။
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
' points ': [8, 12, 14, 14, 15, 22, 27, 24],
' assists ':[2, 2, 3, 5, 7, 6, 8, 12]})
#view DataFrame
print (df)
team points assists
0 to 8 2
1 to 12 2
2 to 14 3
3 to 14 5
4 B 15 7
5 B 22 6
6 B 27 8
7 B 24 12
အဖွဲ့ တစ်ခုစီအတွက် အမှတ်များ ကော်လံရှိ တန်ဖိုးများကို အကျဉ်းချုပ်ရန် groupby() လုပ်ဆောင်ချက်ဖြင့် describe() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။
#summarize points by team
df. groupby (' team ')[' points ']. describe ()
count mean std min 25% 50% 75% max
team
A 4.0 12.0 2.828427 8.0 11.00 13.0 14.00 14.0
B 4.0 22.0 5.099020 15.0 20.25 23.0 24.75 27.0
ရလဒ်မှ အသင်းတစ်သင်းချင်းစီအတွက် အမှတ်များ ပြောင်းလဲနိုင်သော အောက်ပါတန်ဖိုးများကို ကျွန်ုပ်တို့ မြင်တွေ့နိုင်သည်-
- count (ကြည့်ရှုမှုအရေအတွက်)
- ပျမ်းမျှ (ပျမ်းမျှအမှတ်တန်ဖိုး)
- std (အမှတ်တန်ဖိုးများ၏ စံသွေဖည်မှု)
- အနည်းဆုံး (အနည်းဆုံး အမှတ်တန်ဖိုး)
- 25 % (အမှတ်၏ 25th ရာခိုင်နှုန်း)
- 50 % (အမှတ်၏ 50th ရာခိုင်နှုန်း (ဆိုလိုသည်မှာ အလယ်အလတ်))
- 75 % (အမှတ်၏ 75th ရာခိုင်နှုန်း)
- အမြင့်ဆုံး (အမှတ်အများဆုံးတန်ဖိုး)
ရလဒ်များကို DataFrame ဖော်မတ်ဖြင့် ပြသလိုပါက၊ reset_index() အကြောင်းပြချက်ကို အသုံးပြုနိုင်ပါသည်။
#summarize points by team df. groupby (' team ')[' points ']. describe (). reset_index () team count mean std min 25% 50% 75% max 0 A 4.0 12.0 2.828427 8.0 11.00 13.0 14.00 14.0 1 B 4.0 22.0 5.099020 15.0 20.25 23.0 24.75 27.0
team variable သည် ယခုအခါ DataFrame ရှိ ကော်လံတစ်ခုဖြစ်ပြီး အညွှန်းတန်ဖိုးများသည် 0 နှင့် 1 ဖြစ်သည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ပန်ဒါများတွင် အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
Pandas- အုပ်စုတစ်ခုစီအတွက် စုဆောင်းငွေကို တွက်ချက်နည်း
Pandas- အုပ်စုအလိုက် ထူးခြားသောတန်ဖိုးများကို ရေတွက်နည်း
Pandas- အုပ်စုအလိုက် ဆက်စပ်မှုကို တွက်ချက်နည်း