Pandas တွင် describe() function ကို အသုံးပြုပုံ (ဥပမာများဖြင့်)


ပန်ဒါ DataFrame အတွက် ဖော်ပြချက် ကိန်းဂဏန်းများကို ဖန်တီးရန် describe() လုပ်ဆောင်ချက်ကို သင် အသုံးပြုနိုင်သည်။

ဤလုပ်ဆောင်ချက်သည် အောက်ပါအခြေခံ syntax ကိုအသုံးပြုသည်-

 df. describe ()

အောက်ဖော်ပြပါနမူနာများသည် အောက်ပါ pandas DataFrame နှင့် လက်တွေ့တွင် ဤ syntax ကိုမည်သို့အသုံးပြုရမည်ကို ပြသသည် ။

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
df

	team points assists rebounds
0 to 25 5 11
1 to 12 7 8
2 B 15 7 10
3 B 14 9 6
4 B 19 12 6
5 C 23 9 5
6 C 25 9 9
7 C 29 4 12

ဥပမာ 1- ဂဏန်းကော်လံများအားလုံးကို ဖော်ပြပါ။

ပုံသေအားဖြင့်၊ describe() လုပ်ဆောင်ချက်သည် ပန်ဒါ DataFrame ၏ ကိန်းဂဏန်းကော်လံများအတွက်သာ ဖော်ပြချက်စာရင်းဇယားများကို ထုတ်ပေးသည်-

 #generate descriptive statistics for all numeric columns
df. describe ()

	points assists rebounds
count 8.000000 8.00000 8.000000
mean 20.250000 7.75000 8.375000
std 6.158618 2.54951 2.559994
min 12.000000 4.00000 5.000000
25% 14.750000 6.50000 6.000000
50% 21.000000 8.00000 8.500000
75% 25,000000 9,00000 10,250000
max 29.000000 12.00000 12.000000

DataFrame ၏ ကိန်းဂဏန်းကော်လံသုံးခုအတွက် သရုပ်ဖော်ကိန်းဂဏန်းများကို ပြသသည်။

မှတ်ချက်။

ဥပမာ 2- ကော်လံအားလုံးကို ဖော်ပြပါ။

DataFrame ကော်လံတစ်ခုစီအတွက် သရုပ်ဖော်ကိန်းဂဏန်းများကို တွက်ချက်ရန် include=’all’ argument ကို သုံးနိုင်သည်-

 #generate descriptive statistics for all columns
df. describe (include=' all ')

	team points assists rebounds
count 8 8.000000 8.00000 8.000000
single 3 NaN NaN NaN
top B NaN NaN NaN
freq 3 NaN NaN NaN
mean NaN 20.250000 7.75000 8.375000
std NaN 6.158618 2.54951 2.559994
min NaN 12.000000 4.00000 5.000000
25% NaN 14.750000 6.50000 6.000000
50% NaN 21.000000 8.00000 8.500000
75% NaN 25.000000 9.00000 10.250000
max NaN 29.000000 12.00000 12.000000

ဥပမာ 3- သီးခြားကော်လံများကို ဖော်ပြပါ။

အောက်ပါကုဒ်သည် pandas DataFrame ၏ သီးခြားကော်လံအတွက် သရုပ်ဖော်ကိန်းဂဏန်းများကို တွက်ချက်နည်းကို ပြသသည်-

 #calculate descriptive statistics for 'points' column only
df[' points ']. describe ()

count 8.000000
mean 20.250000
std 6.158618
min 12.000000
25% 14.750000
50% 21,000000
75% 25,000000
max 29.000000
Name: points, dtype: float64

အောက်ပါကုဒ်သည် သီးခြားကော်လံများစွာအတွက် သရုပ်ဖော်ကိန်းဂဏန်းများကို တွက်ချက်နည်းကို ပြသသည်-

 #calculate descriptive statistics for 'points' and 'assists' columns only
df[[' points ', ' assists ']]. describe ()

	assist points
count 8.000000 8.00000
mean 20.250000 7.75000
std 6.158618 2.54951
min 12.000000 4.00000
25% 14.750000 6.50000
50% 21,000000 8,00000
75% 25.000000 9.00000
max 29.000000 12.00000

describe() လုပ်ဆောင်ချက်အတွက် စာရွက်စာတမ်းအပြည့်အစုံကို ဤနေရာတွင် ရှာဖွေနိုင်ပါသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ပန်ဒါများတွင် အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

Pandas- ကော်လံတစ်ခုတွင် ထူးခြားသောတန်ဖိုးများကို မည်သို့ရှာမည်နည်း။
Pandas- စာကြောင်းနှစ်ခုကြား ခြားနားချက်ကို ဘယ်လိုရှာမလဲ။
Pandas- DataFrame တွင် ပျောက်ဆုံးနေသောတန်ဖိုးများကို မည်သို့ရေတွက်မည်နည်း။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်