Pandas dataframe အတွက် အကျဉ်းချုပ် ကိန်းဂဏန်း တွက်ချက်နည်း


Pandas DataFrame ရှိ ကိန်းရှင်များအတွက် အကျဉ်းချုပ်စာရင်းအင်းများကို တွက်ချက်ရန် အောက်ပါနည်းလမ်းများကို သင်အသုံးပြုနိုင်ပါသည်။

နည်းလမ်း 1- ကိန်းဂဏာန်းကိန်းရှင်အားလုံးအတွက် အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ပါ။

 df. describe ()

နည်းလမ်း 2- string variable များအားလုံးအတွက် အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ပါ။

 df. describe (include=' object ')

နည်းလမ်း 3- ကိန်းရှင်တစ်ခုဖြင့် အုပ်စုဖွဲ့ထားသော အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ပါ။

 df. groupby (' group_column '). mean ()

df. groupby (' group_column '). median ()

df. groupby (' group_column '). max ()

...

အောက်ဖော်ပြပါနမူနာများသည် အောက်ပါ pandas DataFrame ဖြင့် လက်တွေ့တွင် နည်းလမ်းတစ်ခုစီကို အသုံးပြုနည်းကို ပြသသည်-

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28, 30],
                   ' assists ': [5, np.nan, 7, 9, 12, 9, 9, 4, 5],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, np.nan, 6]})

#view DataFrame
print (df)

  team points assists rebounds
0 to 18 5.0 11.0
1 to 22 NaN 8.0
2 A 19 7.0 10.0
3 A 14 9.0 6.0
4 B 14 12.0 6.0
5 B 11 9.0 5.0
6 B 20 9.0 9.0
7 B 28 4.0 NaN
8 B 30 5.0 6.0

ဥပမာ 1- ကိန်းဂဏာန်းကိန်းရှင်အားလုံးအတွက် အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ပါ။

အောက်ပါကုဒ်သည် DataFrame ရှိ ကိန်းဂဏာန်းကိန်းဂဏန်းတစ်ခုစီအတွက် အနှစ်ချုပ်ကိန်းဂဏန်းများကို တွက်ချက်နည်းကို ပြသသည်-

 df. describe ()

	   points assists rebounds
count 9.000000 8.000000 8.000000
mean 19.555556 7.500000 7.625000
std 6.366143 2.725541 2.199838
min 11.000000 4.000000 5.000000
25% 14,000000 5,000000 6,000000
50% 19,000000 8,000000 7,000000
75% 22.000000 9.000000 9.250000
max 30.000000 12.000000 11.000000

ကိန်းဂဏာန်းကိန်းရှင် သုံးခုအနက် တစ်ခုစီအတွက် အောက်ပါ အကျဉ်းချုပ် ကိန်းဂဏန်းများကို ကျွန်ုပ်တို့ ကြည့်ရှုနိုင်သည်-

  • count- သုညမဟုတ်သော တန်ဖိုးများ အရေအတွက်
  • ပျမ်းမျှ : ပျမ်းမျှတန်ဖိုး
  • std : စံသွေဖည်ခြင်း။
  • min- အနည်းဆုံးတန်ဖိုး
  • 25% : 25th percentile မှ တန်ဖိုး
  • 50% : 50th ရာခိုင်နှုန်းရှိ တန်ဖိုး (အလယ်အလတ်လည်းဖြစ်သည်)
  • 75% – 75th ရာခိုင်နှုန်းရှိ တန်ဖိုး
  • max : အမြင့်ဆုံးတန်ဖိုး

ဥပမာ 2- string variable များအားလုံးအတွက် အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ပါ။

အောက်ပါကုဒ်သည် DataFrame ရှိ string variable တစ်ခုစီအတွက် အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်နည်းကို ပြသည်-

 df. describe (include=' object ')

	team
count 9
single 2
top B
freq 5

ကျွန်ုပ်တို့၏ DataFrame တွင် string variable အတွက် အောက်ပါ အကျဉ်းချုပ်ကိန်းဂဏန်းများကို ကျွန်ုပ်တို့ မြင်တွေ့နိုင်သည်-

  • count : သုညမဟုတ်သော တန်ဖိုးများ အရေအတွက်
  • unique : ထူးခြားသောတန်ဖိုးများ အရေအတွက်
  • ထိပ်တွင် – အများဆုံးမကြာခဏတန်ဖိုး
  • freq : မကြာခဏပေါ်လာသော တန်ဖိုးအရေအတွက်

ဥပမာ 3- ကိန်းရှင်တစ်ခုဖြင့် အုပ်စုဖွဲ့ထားသော အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ပါ။

အောက်ပါကုဒ်သည် အဖွဲ့ ပြောင်းကိန်းအလိုက် အုပ်စုဖွဲ့ထားသော ကိန်းဂဏာန်းကိန်းရှင်အားလုံး၏ ပျမ်းမျှတန်ဖိုးကို တွက်ချက်နည်းကို ပြသသည်-

 df. groupby (' team '). mean ()

	points assists rebounds
team			
A 18.25 7.0 8.75
B 20.60 7.8 6.50

အထွက်သည် အမှတ် များ၏ ပျမ်းမျှတန်ဖိုးကို ပြသည်၊ assists နှင့် rebounds variable များကို team variable အလိုက် အုပ်စုဖွဲ့ထားသည်။

မီဒီယံကဲ့သို့ မတူညီသော အကျဉ်းချုပ်ကိန်းဂဏန်းကို တွက်ချက်ရန် အလားတူ syntax ကို အသုံးပြုနိုင်ကြောင်း သတိပြုပါ-

 df. groupby (' team '). median ()

	points assists rebounds
team			
A 18.5 7.0 9.0
B 20.0 9.0 6.0

အထွက်တွင် အမှတ်များassists နှင့် rebounds variable များteam variable အလိုက် အုပ်စုဖွဲ့ထားသော ပျမ်းမျှတန်ဖိုးကို ပြသည် ။

မှတ်ချက် – ပန်ဒါများတွင် ဖော်ပြချက် လုပ်ဆောင်ချက်၏ စာရွက်စာတမ်းအပြည့်အစုံကို ဤနေရာတွင် ရှာတွေ့နိုင်ပါသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် အခြားဘုံပန်ဒါတာဝန်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

ပန်ဒါများတွင် အုပ်စုလိုက်တွေ့ခြင်းကို ရေတွက်နည်း
Pandas တွင် အုပ်စုတစ်ခုလျှင် အများဆုံးတန်ဖိုးကို မည်သို့ရှာမည်နည်း။
ပန်ဒါများတွင် အစွန်းအထင်းများကို မည်သို့ခွဲခြားနိုင်မည်နည်း။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်