Pandas dataframe အတွက် အကျဉ်းချုပ် ကိန်းဂဏန်း တွက်ချက်နည်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 20, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

Pandas DataFrame ရှိ ကိန်းရှင်များအတွက် အကျဉ်းချုပ်စာရင်းအင်းများကို တွက်ချက်ရန် အောက်ပါနည်းလမ်းများကို သင်အသုံးပြုနိုင်ပါသည်။

နည်းလမ်း 1- ကိန်းဂဏာန်းကိန်းရှင်အားလုံးအတွက် အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ပါ။

 df. describe ()

နည်းလမ်း 2- string variable များအားလုံးအတွက် အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ပါ။

 df. describe (include=' object ')

နည်းလမ်း 3- ကိန်းရှင်တစ်ခုဖြင့် အုပ်စုဖွဲ့ထားသော အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ပါ။

 df. groupby (' group_column '). mean ()

df. groupby (' group_column '). median ()

df. groupby (' group_column '). max ()

...

အောက်ဖော်ပြပါနမူနာများသည် အောက်ပါ pandas DataFrame ဖြင့် လက်တွေ့တွင် နည်းလမ်းတစ်ခုစီကို အသုံးပြုနည်းကို ပြသသည်-

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28, 30],
                   ' assists ': [5, np.nan, 7, 9, 12, 9, 9, 4, 5],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, np.nan, 6]})

#view DataFrame
print (df)

  team points assists rebounds
0 to 18 5.0 11.0
1 to 22 NaN 8.0
2 A 19 7.0 10.0
3 A 14 9.0 6.0
4 B 14 12.0 6.0
5 B 11 9.0 5.0
6 B 20 9.0 9.0
7 B 28 4.0 NaN
8 B 30 5.0 6.0

ဥပမာ 1- ကိန်းဂဏာန်းကိန်းရှင်အားလုံးအတွက် အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ပါ။

အောက်ပါကုဒ်သည် DataFrame ရှိ ကိန်းဂဏာန်းကိန်းဂဏန်းတစ်ခုစီအတွက် အနှစ်ချုပ်ကိန်းဂဏန်းများကို တွက်ချက်နည်းကို ပြသသည်-

 df. describe ()

	   points assists rebounds
count 9.000000 8.000000 8.000000
mean 19.555556 7.500000 7.625000
std 6.366143 2.725541 2.199838
min 11.000000 4.000000 5.000000
25% 14,000000 5,000000 6,000000
50% 19,000000 8,000000 7,000000
75% 22.000000 9.000000 9.250000
max 30.000000 12.000000 11.000000

ကိန်းဂဏာန်းကိန်းရှင် သုံးခုအနက် တစ်ခုစီအတွက် အောက်ပါ အကျဉ်းချုပ် ကိန်းဂဏန်းများကို ကျွန်ုပ်တို့ ကြည့်ရှုနိုင်သည်-

count- သုညမဟုတ်သော တန်ဖိုးများ အရေအတွက်
ပျမ်းမျှ : ပျမ်းမျှတန်ဖိုး
std : စံသွေဖည်ခြင်း။
min- အနည်းဆုံးတန်ဖိုး
25% : 25th percentile မှ တန်ဖိုး
50% : 50th ရာခိုင်နှုန်းရှိ တန်ဖိုး (အလယ်အလတ်လည်းဖြစ်သည်)
75% – 75th ရာခိုင်နှုန်းရှိ တန်ဖိုး
max : အမြင့်ဆုံးတန်ဖိုး

ဥပမာ 2- string variable များအားလုံးအတွက် အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ပါ။

အောက်ပါကုဒ်သည် DataFrame ရှိ string variable တစ်ခုစီအတွက် အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်နည်းကို ပြသည်-

 df. describe (include=' object ')

	team
count 9
single 2
top B
freq 5

ကျွန်ုပ်တို့၏ DataFrame တွင် string variable အတွက် အောက်ပါ အကျဉ်းချုပ်ကိန်းဂဏန်းများကို ကျွန်ုပ်တို့ မြင်တွေ့နိုင်သည်-

count : သုညမဟုတ်သော တန်ဖိုးများ အရေအတွက်
unique : ထူးခြားသောတန်ဖိုးများ အရေအတွက်
ထိပ်တွင် – အများဆုံးမကြာခဏတန်ဖိုး
freq : မကြာခဏပေါ်လာသော တန်ဖိုးအရေအတွက်

ဥပမာ 3- ကိန်းရှင်တစ်ခုဖြင့် အုပ်စုဖွဲ့ထားသော အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ပါ။

အောက်ပါကုဒ်သည် အဖွဲ့ ပြောင်းကိန်းအလိုက် အုပ်စုဖွဲ့ထားသော ကိန်းဂဏာန်းကိန်းရှင်အားလုံး၏ ပျမ်းမျှတန်ဖိုးကို တွက်ချက်နည်းကို ပြသသည်-

 df. groupby (' team '). mean ()

	points assists rebounds
team			
A 18.25 7.0 8.75
B 20.60 7.8 6.50

အထွက်သည် အမှတ် များ၏ ပျမ်းမျှတန်ဖိုးကို ပြသည်၊ assists နှင့် rebounds variable များကို team variable အလိုက် အုပ်စုဖွဲ့ထားသည်။

မီဒီယံကဲ့သို့ မတူညီသော အကျဉ်းချုပ်ကိန်းဂဏန်းကို တွက်ချက်ရန် အလားတူ syntax ကို အသုံးပြုနိုင်ကြောင်း သတိပြုပါ-

 df. groupby (' team '). median ()

	points assists rebounds
team			
A 18.5 7.0 9.0
B 20.0 9.0 6.0

အထွက်တွင် အမှတ်များ ၊ assists နှင့် rebounds variable များ ၊ team variable အလိုက် အုပ်စုဖွဲ့ထားသော ပျမ်းမျှတန်ဖိုးကို ပြသည် ။

မှတ်ချက် – ပန်ဒါများတွင် ဖော်ပြချက် လုပ်ဆောင်ချက်၏ စာရွက်စာတမ်းအပြည့်အစုံကို ဤနေရာတွင် ရှာတွေ့နိုင်ပါသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် အခြားဘုံပန်ဒါတာဝန်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

ပန်ဒါများတွင် အုပ်စုလိုက်တွေ့ခြင်းကို ရေတွက်နည်း
Pandas တွင် အုပ်စုတစ်ခုလျှင် အများဆုံးတန်ဖိုးကို မည်သို့ရှာမည်နည်း။
ပန်ဒါများတွင် အစွန်းအထင်းများကို မည်သို့ခွဲခြားနိုင်မည်နည်း။

စာရေးသူအကြောင်း

Benjamin Anderson

မင်္ဂလာပါ၊ ကျွန်ုပ်သည် အငြိမ်းစား စာရင်းအင်း ပါမောက္ခ ဘင်ဂျမင်ဖြစ်ပြီး သီးသန့် Statorials ဆရာအဖြစ် လှည့်ပတ်ပါသည်။ စာရင်းဇယားနယ်ပယ်တွင် ကျယ်ပြန့်သောအတွေ့အကြုံနှင့် ကျွမ်းကျင်မှုနှင့်အတူ၊ Statorials မှတစ်ဆင့် ကျောင်းသားများကို ခွန်အားဖြစ်စေရန်အတွက် ကျွန်ုပ်၏အသိပညာကို မျှဝေလိုပါသည်။ ပိုသိတယ်။