Pandas- သတ်မှတ်ထားသော ရာခိုင်နှုန်းများနှင့်အတူ describe() ကို အသုံးပြုပုံ
pandas DataFrame အတွင်းရှိ variable များအတွက် descriptive statistics ကို ဖန်တီးရန် describe() လုပ်ဆောင်ချက်ကို သင်အသုံးပြုနိုင်ပါသည်။
ပုံမှန်အားဖြင့်၊ ပန်ဒါများသည် ကိန်းရှင်များအတွက် 25th၊ 50th နှင့် 75th ရာခိုင်နှုန်းများကို တွက်ချက်သည်။
သို့သော်၊ တွက်ချက်ရန် အတိအကျ ရာခိုင်နှုန်းများကို သတ်မှတ်ရန် describe() လုပ်ဆောင်ချက်ရှိ ရာခိုင်နှုန်း အငြင်းပွားမှုကို သင်အသုံးပြုနိုင်သည်။
အောက်ဖော်ပြပါ ဥပမာများသည် အောက်ပါ ပန်ဒါ DataFrame နှင့် လက်တွေ့တွင် ဤအငြင်းအခုံကို အသုံးပြုနည်းကို ပြသသည်-
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
' points ': [18, 22, 19, 14, 14, 11, 20, 28],
' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
#view DataFrame
print (df)
team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12
ဥပမာ 1- ပုံသေရာခိုင်နှုန်းများနှင့်အတူ describe() ကိုအသုံးပြုခြင်း။
DataFrame ရှိ ကိန်းဂဏာန်းကိန်းရှင်တစ်ခုစီအတွက် ဖော်ပြချက်ကိန်းဂဏန်းများကို တွက်ချက်ရန် အောက်ပါကုဒ်သည် describe() လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-
#calculate descriptive statistics for each numeric variable
df. describe ()
points assists rebounds
count 8.000000 8.00000 8.000000
mean 18.250000 7.75000 8.375000
std 5.365232 2.54951 2.559994
min 11.000000 4.00000 5.000000
25% 14,000000 6,50000 6,000000
50% 18.500000 8.00000 8.500000
75% 20.500000 9.00000 10.250000
max 28.000000 12.00000 12.000000
describe() လုပ်ဆောင်ချက်သည် ကိန်းရှင်တစ်ခုစီအတွက် 25th၊ 50th နှင့် 75th ရာခိုင်နှုန်းများကို ပုံသေဖြင့်တွက်ချက်ကြောင်း သတိပြုပါ။
ဥပမာ 2- စိတ်ကြိုက် ရာခိုင်နှုန်းများနှင့်အတူ describe() ကို အသုံးပြုခြင်း။
DataFrame ရှိ ကိန်းဂဏန်းကိန်းရှင်တစ်ခုစီအတွက် 30th၊ 60th နှင့် 90th percentiles များကို တွက်ချက်ရန် အောက်ပါကုဒ်သည် describe() လုပ်ဆောင်ချက်ကို percentiles argument ဖြင့် ပြသသည်-
#calculate custom percentiles for each numeric variable
df. describe (percentiles=[ .3 , .6 , .9 ])
points assists rebounds
count 8.000000 8.00000 8.000000
mean 18.250000 7.75000 8.375000
std 5.365232 2.54951 2.559994
min 11.000000 4.00000 5.000000
30% 14.400000 7.00000 6.200000
50% 18.500000 8.00000 8.500000
60% 19.200000 9.00000 9.200000
90% 23.800000 9.90000 11.300000
max 28.000000 12.00000 12.000000
describe() လုပ်ဆောင်ချက်သည် ကိန်းဂဏန်းကိန်းရှင်တစ်ခုစီအတွက် 30th၊ 60 နှင့် 90th ရာခိုင်နှုန်းများကို ပြန်ပေးကြောင်း သတိပြုပါ။
မှတ်ချက် – describe() လုပ်ဆောင်ချက်သည် ကိန်းရှင်တစ်ခုစီ၏ ပျမ်းမျှတန်ဖိုးကို ကိုယ်စားပြုပြီး describe() လုပ်ဆောင်ချက်ဖြင့် တွက်ချက်ထားသော ပုံသေမက်ထရစ်များထဲမှ တစ်ခုဖြစ်သောကြောင့် 50th ရာခိုင်နှုန်းကိုလည်း ပြန်ပေးပါသည်။
ဥပမာ 3- ရာခိုင်နှုန်းမပါတဲ့ describe() ကိုအသုံးပြုခြင်း။
အောက်ပါကုဒ်သည် DataFrame ရှိ ကိန်းဂဏာန်းကိန်းရှင်တစ်ခုစီအတွက် ရာခိုင်နှုန်းမရှိ တွက်ချက်ရန် percentiles=[] အငြင်းအခုံဖြင့် describe() လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-
#calculate no percentiles for each numeric variable
df. describe (percentiles=[])
points assists rebounds
count 8.000000 8.00000 8.000000
mean 18.250000 7.75000 8.375000
std 5.365232 2.54951 2.559994
min 11.000000 4.00000 5.000000
50% 18.500000 8.00000 8.500000
max 28.000000 12.00000 12.000000
ကိန်းရှင်တစ်ခုစီအတွက် 25th နှင့် 75th ရာခိုင်နှုန်းများကို မတွက်ချက်တော့ကြောင်း သတိပြုပါ။
ကိန်းရှင်တစ်ခုစီ၏ ပျမ်းမျှတန်ဖိုးကို ကိုယ်စားပြုသောကြောင့် ရလဒ်တွင် 50th ရာခိုင်နှုန်းကို အမြဲတမ်းထည့်သွင်းထားကြောင်း သတိပြုပါ။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ပန်ဒါများတွင် အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
Pandas- အုပ်စုအလိုက် describe() အသုံးပြုပုံ
Pandas- describe() ကို အသုံးပြုနည်းနှင့် သိပ္ပံနည်းကျ အမှတ်အသားများကို ဖယ်ရှားနည်း
Pandas- ပျမ်းမျှ၊ ပျမ်းမျှနှင့် မုဒ်ကို တွက်ချက်နည်း