Pandas value_counts() function (ဥပမာများနှင့်အတူ) အသုံးပြုပုံ


ပန်ဒါစီးရီးတစ်ခုရှိ ထူးခြားသောတန်ဖိုးများ၏ အကြိမ်ရေကိုရေတွက်ရန် value_counts() လုပ်ဆောင်ချက်ကို သင်အသုံးပြုနိုင်သည်။

ဤလုပ်ဆောင်ချက်သည် အောက်ပါအခြေခံ syntax ကိုအသုံးပြုသည်-

 my_series. value_counts ()

အောက်ပါဥပမာများသည် ဤ syntax ကိုလက်တွေ့တွင်မည်သို့အသုံးပြုရမည်ကိုပြသထားသည်။

ဥပမာ 1- ထူးခြားသောတန်ဖိုးများ၏ ကြိမ်နှုန်းကိုရေတွက်ပါ။

အောက်ဖော်ပြပါ ကုဒ်သည် ပန်ဒါစီးရီးတစ်ခုတွင် ထူးခြားသောတန်ဖိုးများ ဖြစ်ပေါ်လာပုံကို ရေတွက်ပုံပြသည်-

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts ()

3 4
4 2
7 2
8 1
9 1
dtype: int64

၎င်းသည် ကျွန်ုပ်တို့အား ပြောပြသည်-

  • တန်ဖိုး 3 သည် 4 ကြိမ်ပေါ်လာသည်။
  • တန်ဖိုး 4 သည် နှစ်ခါ ပေါ်လာသည်။
  • တန်ဖိုး 7 သည် နှစ်ခါ ပေါ်လာသည်။

နောက် … ပြီးတော့။

ဥပမာ 2- ထူးခြားသောတန်ဖိုးများ (NaN အပါအဝင်) ကြိမ်နှုန်းကိုရေတွက်ပါ။

ပုံမှန်အားဖြင့်၊ value_counts() လုပ်ဆောင်ချက်သည် NaN တန်ဖိုးများ၏ ကြိမ်နှုန်းကို ပြသမည်မဟုတ်ပါ။

သို့သော်၊ သင်သည် NaN တန်ဖိုးများ၏ အကြိမ်ရေကိုပြသရန် dropna အငြင်းအခုံကို အသုံးပြုနိုင်သည်။

 import pandas as pd
import numpy as np

#create pandas Series with some NaN values
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9, np.nan, np.nan])

#count occurrences of unique values in Series, including NaNs
my_series. value_counts (dropna= False )

3.0 4
4.0 2
7.0 2
NaN2
8.0 1
9.0 1
dtype: int64

ဥပမာ 3- ထူးခြားသောတန်ဖိုးများ၏ နှိုင်းရကြိမ်နှုန်းကို ရေတွက်ပါ။

အောက်ဖော်ပြပါကုဒ်သည် ပန်ဒါစီးရီးတစ်ခုရှိ ထူးခြားသောတန်ဖိုးများ၏ နှိုင်းရကြိမ်နှုန်းကို ရေတွက်ရန်အတွက် ပုံမှန် အငြင်းပွားမှုကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts (normalize= True )

3 0.4
4 0.2
7 0.2
8 0.1
9 0.1
dtype:float64

၎င်းသည် ကျွန်ုပ်တို့အား ပြောပြသည်-

  • တန်ဖိုး 3 သည် စီးရီးရှိ တန်ဖိုးအားလုံး၏ 40% ကို ကိုယ်စားပြုသည်။
  • တန်ဖိုး 4 သည် စီးရီးရှိ တန်ဖိုးများအားလုံး၏ 20% ကို ကိုယ်စားပြုသည်။
  • တန်ဖိုး 7 သည် စီးရီးရှိ တန်ဖိုးများအားလုံး၏ 20% ကို ကိုယ်စားပြုသည်။

နောက် … ပြီးတော့။

ဥပမာ 4- ပုံးများတွင် အကြိမ်ရေရေတွက်ခြင်း။

အရွယ်အစားတူညီသော bins များထဲသို့ ကျနေသော ပန်ဒါစီးရီးတစ်ခုရှိ တန်ဖိုးများ၏ အကြိမ်ရေကို ရေတွက်ရန် အောက်ပါကုဒ်သည် bins အငြင်းအခုံကို အသုံးပြုနည်းကို ပြသသည်-

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts (bins= 3 )

(3.0, 5.0] 6
(5.0, 7.0] 2
(7.0, 9.0] 2
dtype: int64

၎င်းသည် ကျွန်ုပ်တို့အား ပြောပြသည်-

  • 3 နှင့် 5 အကြားတန်ဖိုး 6 ခု ရှိသည်။
  • 5 နှင့် 7 အကြားတန်ဖိုး 2 ခု ရှိသည်။
  • 7 နှင့် 9 အကြားတန်ဖိုး 2 ခု ရှိသည်။

ဥပမာ 5: Pandas DataFrame တွင် တန်ဖိုးများ၏ ကြိမ်နှုန်းကို ရေတွက်ပါ။

pandas DataFrame ကော်လံတစ်ခုရှိ သီးခြားတန်ဖိုးများ၏ ကြိမ်နှုန်းကို တွက်ချက်ရန် value_counts() လုပ်ဆောင်ချက်ကိုလည်း အသုံးပြုနိုင်သည်။

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' points ': [9, 9, 9, 10, 10, 13, 15, 22],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
#count occurrences of unique values in 'points' column
df[' points ']. value_counts ()

9 3
10 2
13 1
15 1
22 1
Name: points, dtype: int64

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ပန်ဒါများတွင် အခြားဘုံလုပ်ဆောင်ချက်များကို အသုံးပြုနည်းကို ရှင်းပြသည်-

Pandas တွင် describe() လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်နည်း။
Pandas တွင် အတန်းအရေအတွက်ကို ရေတွက်နည်း
ပန်ဒါများတွင် အုပ်စုလိုက်တွေ့ခြင်းကို ရေတွက်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်