Pandas value_counts() function (ဥပမာများနှင့်အတူ) အသုံးပြုပုံ
ပန်ဒါစီးရီးတစ်ခုရှိ ထူးခြားသောတန်ဖိုးများ၏ အကြိမ်ရေကိုရေတွက်ရန် value_counts() လုပ်ဆောင်ချက်ကို သင်အသုံးပြုနိုင်သည်။
ဤလုပ်ဆောင်ချက်သည် အောက်ပါအခြေခံ syntax ကိုအသုံးပြုသည်-
my_series. value_counts ()
အောက်ပါဥပမာများသည် ဤ syntax ကိုလက်တွေ့တွင်မည်သို့အသုံးပြုရမည်ကိုပြသထားသည်။
ဥပမာ 1- ထူးခြားသောတန်ဖိုးများ၏ ကြိမ်နှုန်းကိုရေတွက်ပါ။
အောက်ဖော်ပြပါ ကုဒ်သည် ပန်ဒါစီးရီးတစ်ခုတွင် ထူးခြားသောတန်ဖိုးများ ဖြစ်ပေါ်လာပုံကို ရေတွက်ပုံပြသည်-
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts () 3 4 4 2 7 2 8 1 9 1 dtype: int64
၎င်းသည် ကျွန်ုပ်တို့အား ပြောပြသည်-
- တန်ဖိုး 3 သည် 4 ကြိမ်ပေါ်လာသည်။
- တန်ဖိုး 4 သည် နှစ်ခါ ပေါ်လာသည်။
- တန်ဖိုး 7 သည် နှစ်ခါ ပေါ်လာသည်။
နောက် … ပြီးတော့။
ဥပမာ 2- ထူးခြားသောတန်ဖိုးများ (NaN အပါအဝင်) ကြိမ်နှုန်းကိုရေတွက်ပါ။
ပုံမှန်အားဖြင့်၊ value_counts() လုပ်ဆောင်ချက်သည် NaN တန်ဖိုးများ၏ ကြိမ်နှုန်းကို ပြသမည်မဟုတ်ပါ။
သို့သော်၊ သင်သည် NaN တန်ဖိုးများ၏ အကြိမ်ရေကိုပြသရန် dropna အငြင်းအခုံကို အသုံးပြုနိုင်သည်။
import pandas as pd import numpy as np #create pandas Series with some NaN values my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9, np.nan, np.nan]) #count occurrences of unique values in Series, including NaNs my_series. value_counts (dropna= False ) 3.0 4 4.0 2 7.0 2 NaN2 8.0 1 9.0 1 dtype: int64
ဥပမာ 3- ထူးခြားသောတန်ဖိုးများ၏ နှိုင်းရကြိမ်နှုန်းကို ရေတွက်ပါ။
အောက်ဖော်ပြပါကုဒ်သည် ပန်ဒါစီးရီးတစ်ခုရှိ ထူးခြားသောတန်ဖိုးများ၏ နှိုင်းရကြိမ်နှုန်းကို ရေတွက်ရန်အတွက် ပုံမှန် အငြင်းပွားမှုကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts (normalize= True ) 3 0.4 4 0.2 7 0.2 8 0.1 9 0.1 dtype:float64
၎င်းသည် ကျွန်ုပ်တို့အား ပြောပြသည်-
- တန်ဖိုး 3 သည် စီးရီးရှိ တန်ဖိုးအားလုံး၏ 40% ကို ကိုယ်စားပြုသည်။
- တန်ဖိုး 4 သည် စီးရီးရှိ တန်ဖိုးများအားလုံး၏ 20% ကို ကိုယ်စားပြုသည်။
- တန်ဖိုး 7 သည် စီးရီးရှိ တန်ဖိုးများအားလုံး၏ 20% ကို ကိုယ်စားပြုသည်။
နောက် … ပြီးတော့။
ဥပမာ 4- ပုံးများတွင် အကြိမ်ရေရေတွက်ခြင်း။
အရွယ်အစားတူညီသော bins များထဲသို့ ကျနေသော ပန်ဒါစီးရီးတစ်ခုရှိ တန်ဖိုးများ၏ အကြိမ်ရေကို ရေတွက်ရန် အောက်ပါကုဒ်သည် bins အငြင်းအခုံကို အသုံးပြုနည်းကို ပြသသည်-
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts (bins= 3 ) (3.0, 5.0] 6 (5.0, 7.0] 2 (7.0, 9.0] 2 dtype: int64
၎င်းသည် ကျွန်ုပ်တို့အား ပြောပြသည်-
- 3 နှင့် 5 အကြားတန်ဖိုး 6 ခု ရှိသည်။
- 5 နှင့် 7 အကြားတန်ဖိုး 2 ခု ရှိသည်။
- 7 နှင့် 9 အကြားတန်ဖိုး 2 ခု ရှိသည်။
ဥပမာ 5: Pandas DataFrame တွင် တန်ဖိုးများ၏ ကြိမ်နှုန်းကို ရေတွက်ပါ။
pandas DataFrame ကော်လံတစ်ခုရှိ သီးခြားတန်ဖိုးများ၏ ကြိမ်နှုန်းကို တွက်ချက်ရန် value_counts() လုပ်ဆောင်ချက်ကိုလည်း အသုံးပြုနိုင်သည်။
import pandas as pd #createDataFrame df = pd. DataFrame ({' points ': [9, 9, 9, 10, 10, 13, 15, 22], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #count occurrences of unique values in 'points' column df[' points ']. value_counts () 9 3 10 2 13 1 15 1 22 1 Name: points, dtype: int64
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ပန်ဒါများတွင် အခြားဘုံလုပ်ဆောင်ချက်များကို အသုံးပြုနည်းကို ရှင်းပြသည်-
Pandas တွင် describe() လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်နည်း။
Pandas တွင် အတန်းအရေအတွက်ကို ရေတွက်နည်း
ပန်ဒါများတွင် အုပ်စုလိုက်တွေ့ခြင်းကို ရေတွက်နည်း