Pandas- mean နှင့် std အတွက် describe() ကို ဘယ်လိုသုံးမလဲ။


pandas DataFrame အတွင်းရှိ variable များအတွက် descriptive statistics ကို ဖန်တီးရန် describe() လုပ်ဆောင်ချက်ကို သင်အသုံးပြုနိုင်ပါသည်။

ပုံသေအားဖြင့်၊ describe() လုပ်ဆောင်ချက်သည် DataFrame တစ်ခုရှိ ကိန်းဂဏာန်းတစ်ခုစီအတွက် အောက်ပါမက်ထရစ်များကို တွက်ချက်သည်-

  • count (တန်ဖိုးအရေအတွက်)
  • ပျမ်းမျှ (ပျမ်းမျှတန်ဖိုး)
  • std (စံသွေဖည်)
  • အနည်းဆုံး (အနည်းဆုံးတန်ဖိုး)
  • 25% (25th ရာခိုင်နှုန်း)
  • 50% (50th ရာခိုင်နှုန်း)
  • 75% (75th ရာခိုင်နှုန်း)
  • အမြင့်ဆုံး (အမြင့်ဆုံးတန်ဖိုး)

သို့သော်၊ ကိန်းဂဏာန်းတစ်ခုစီ၏ ပျမ်းမျှနှင့် စံသွေဖည်မှုကိုသာ တွက်ချက်ရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်သည်။

 df. describe (). loc [[' mean ', ' std ']]

အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။

ဥပမာ- ပျမ်းမျှနှင့် စံနှုန်းကိုသာတွက်ချက်ရန် Pandas တွင် describe() ကိုသုံးပါ။

အမျိုးမျိုးသော ဘတ်စကတ်ဘောကစားသမားများအကြောင်း အချက်အလက်ပါရှိသော အောက်ပါပန်ဒါ DataFrame ရှိသည်ဆိုပါစို့။

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12

ကျွန်ုပ်တို့သည် describe() လုပ်ဆောင်ချက်ကို အသုံးပြုပါက၊ DataFrame ရှိ ကိန်းဂဏာန်းတစ်ခုစီအတွက် ဖော်ပြချက်ကိန်းဂဏန်းများကို တွက်ချက်နိုင်သည်-

 #calculate descriptive statistics for each numeric variable
df. describe ()

points assists rebounds
count 8.000000 8.00000 8.000000
mean 18.250000 7.75000 8.375000
std 5.365232 2.54951 2.559994
min 11.000000 4.00000 5.000000
25% 14,000000 6,50000 6,000000
50% 18.500000 8.00000 8.500000
75% 20.500000 9.00000 10.250000
max 28.000000 12.00000 12.000000

သို့သော်၊ ကိန်းဂဏာန်းတစ်ခုစီ၏ ပျမ်းမျှ နှင့် စံသွေဖည်မှုကို တွက်ချက်ရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။

 #only calculate mean and standard deviation of each numeric variable
df. describe (). loc [[' mean ', ' std ']]

           points assists rebounds
mean 18.250000 7.75000 8.375000
std 5.365232 2.54951 2.559994

ကိန်းဂဏာန်းကိန်းရှင်တစ်ခုစီအတွက် ပျမ်းမျှနှင့် စံသွေဖည်မှုသာ ပါဝင်ကြောင်း သတိပြုပါ။

describe() လုပ်ဆောင်ချက်သည် ယခင်ကဲ့သို့ သရုပ်ဖော်ကိန်းဂဏန်းတစ်ခုစီကို တွက်ချက်နေဆဲဖြစ်သည်ကို သတိပြုပါ၊ သို့သော် အထွက်တွင် mean နှင့် std အမည်ရှိသော အတန်းများကိုသာ ရွေးချယ်ရန်အတွက် loc လုပ်ဆောင်ချက်ကို ကျွန်ုပ်တို့ အသုံးပြုခဲ့သည်။

ဆက်စပ်- Pandas loc vs iloc- ကွာခြားချက်ကား အဘယ်နည်း။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ပန်ဒါများတွင် အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

Pandas- အုပ်စုအလိုက် describe() အသုံးပြုပုံ
Pandas- သတ်မှတ်ထားသော ရာခိုင်နှုန်းများနှင့်အတူ describe() ကို အသုံးပြုပုံ
Pandas- describe() ကို အသုံးပြုနည်းနှင့် သိပ္ပံနည်းကျ အမှတ်အသားများကို ဖယ်ရှားနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်