Python တွင် deciles တွက်ချက်နည်း- ဥပမာများဖြင့်


ကိန်းဂဏန်းစာရင်းဇယားများတွင်၊ deciles များသည် ကိန်းဂဏန်းများကို ကြိမ်နှုန်းတန်းတူ အုပ်စုဆယ်စုအဖြစ် ပိုင်းခြားထားသော ကိန်းဂဏာန်းများဖြစ်သည်။

ပထမ decile သည် ဒေတာတန်ဖိုးအားလုံး၏ 10% အောက်တွင် ကျရောက်သည့် အမှတ်ဖြစ်သည်။ ဒုတိယ decile သည် ဒေတာတန်ဖိုးများအားလုံး၏ 20% အောက်တွင် ကျရောက်သည့် အမှတ်ဖြစ်သွားပြီဖြစ်သည်။

Python တွင် dataset တစ်ခု၏ deciles များကို တွက်ချက်ရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။

 import numpy as np

n.p. percentile (var, np. arange (0, 100, 10))

အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။

ဥပမာ- Python တွင် ကိန်းဂဏန်းများကို တွက်ချက်ပါ။

အောက်ပါကုဒ်သည် တန်ဖိုး 20 ဖြင့် ဒေတာအတွဲအတုကို ဖန်တီးနည်းကို ပြသပြီး ဒေတာအတွဲ၏ decile တန်ဖိုးများကို တွက်ချက်သည်-

 import numpy as np

#createdata
data = np. array ([56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
                 89, 90, 91, 92, 93, 93, 94, 95, 97, 99])

#calculate deciles of data
n.p. percentile (data, np. arange (0, 100, 10))

array([56., 63.4, 67.8, 76.5, 83.6, 88.5, 90.4, 92.3, 93.2, 95.2])

decis များကို အဓိပ္ပာယ်ဖွင့်ဆိုရန် နည်းလမ်းမှာ အောက်ပါအတိုင်းဖြစ်သည်။

  • ဒေတာတန်ဖိုးများအားလုံး၏ 10% သည် 63.4 ထက်နည်းပါသည်။
  • ဒေတာတန်ဖိုးအားလုံး၏ 20% သည် 67.8 ထက်နည်းပါသည်။
  • ဒေတာတန်ဖိုးအားလုံး၏ 30% သည် 76.5 ထက်နည်းပါသည်။
  • ဒေတာတန်ဖိုးအားလုံး၏ 40% သည် 83.6 ထက်နည်းပါသည်။
  • ဒေတာတန်ဖိုးအားလုံး၏ 50% သည် 88.5 ထက်နည်းပါသည်။
  • ဒေတာတန်ဖိုးအားလုံး၏ 60% သည် 90.4 ထက်နည်းပါသည်။
  • ဒေတာတန်ဖိုးအားလုံး၏ 70% သည် 92.3 ထက်နည်းပါသည်။
  • ဒေတာတန်ဖိုးအားလုံး၏ 80% သည် 93.2 ထက်နည်းပါသည်။
  • ဒေတာတန်ဖိုးအားလုံး၏ 90% သည် 95.2 ထက်နည်းပါသည်။

output (56) ၏ ပထမတန်ဖိုးသည် data set ၏ အနည်းဆုံးတန်ဖိုးကို ညွှန်ပြသည်ကို သတိပြုပါ။

ဥပမာ- Python တွင် Deciles တွင်တန်ဖိုးများထည့်ခြင်း။

ဒေတာတန်ဖိုးတစ်ခုစီကို decile တွင်ထားရန်၊ ကျွန်ုပ်တို့သည် pandas qcut လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။

ဤလုပ်ဆောင်ချက်သည် ယခင်နမူနာတွင် ကျွန်ုပ်တို့ဖန်တီးခဲ့သည့် ဒေတာအတွဲအတွက် ဤလုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်နည်း။

 import pandas as pd

#create data frame
df = pd. DataFrame ({' values ': [56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
                              89, 90, 91, 92, 93, 93, 94, 95, 97, 99]})

#calculate decile of each value in data frame
df[' Decile '] = pd. qcut (df[' values '], 10, labels= False )

#display data frame
df

	values Decile
0 56 0
1 58 0
2 64 1
3 67 1
4 68 2
5 73 2
6 78 3
7 83 3
8 84 4
9 88 4
10 89 5
11 90 5
12 91 6
13 92 6
14 93 7
15 93 7
16 94 8
17 95 8
18 97 9
19 99 9

ရလဒ်ကို အဓိပ္ပာယ်ဖွင့်ဆိုရန် နည်းလမ်းမှာ အောက်ပါအတိုင်းဖြစ်သည်။

  • ဒေတာတန်ဖိုး 56 သည် ရာခိုင်နှုန်း 0% နှင့် 10% အကြားရှိသောကြောင့် ၎င်းသည် decile 0 ဖြစ်သည်။
  • ဒေတာတန်ဖိုး 58 သည် ရာခိုင်နှုန်း 0% နှင့် 10% အကြားရှိသောကြောင့် ၎င်းသည် decile 0 ဖြစ်သည်။
  • ဒေတာတန်ဖိုး 64 သည် 10% နှင့် 20% ရာခိုင်နှုန်းကြားရှိသောကြောင့် ၎င်းသည် decile 1 ဖြစ်သည်။
  • ဒေတာတန်ဖိုး 67 သည် 10% နှင့် 20% ရာခိုင်နှုန်းကြားတွင် ကျရောက်သောကြောင့် ၎င်းသည် decile 1 သို့ ကျရောက်သည်။
  • ဒေတာတန်ဖိုး 68 သည် 20% နှင့် 30% ရာခိုင်နှုန်းကြားတွင် ကျရောက်သောကြောင့် ၎င်းသည် decile 2 သို့ ကျရောက်သည်။

နောက် … ပြီးတော့။

ထပ်လောင်းအရင်းအမြစ်များ

Python တွင် ရာခိုင်နှုန်းများကို တွက်ချက်နည်း
Python ရှိ interquartile range ကို တွက်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်