Python တွင် z ရမှတ်များကို တွက်ချက်နည်း
ကိန်းဂဏန်းစာရင်းဇယားများတွင်၊ z-score သည် စံနှုန်း တစ်ခုမှ တန်ဖိုးတစ်ခုသွေဖည်မှုမည်မျှရှိသည်ကို ပြောပြသည်။ z-score ကိုတွက်ချက်ရန် အောက်ပါဖော်မြူလာကို ကျွန်ုပ်တို့အသုံးပြုသည်-
z = (X – μ) / σ
ရွှေ-
- X သည် ဒေတာအကြမ်းတစ်ခုတည်းတန်ဖိုးဖြစ်သည်။
- µ သည် လူဦးရေကို ဆိုလိုသည်။
- σ သည် လူဦးရေစံသွေဖည်သည်။
ဤသင်ခန်းစာသည် Python ရှိ ဒေတာအကြမ်းတန်ဖိုးများအတွက် z-ရမှတ်များကို တွက်ချက်နည်းကို ရှင်းပြထားသည်။
Python တွင် Z ရမှတ်များကို တွက်ချက်နည်း
အောက်ပါ syntax ကိုအသုံးပြုသည့် scipy.stats.zscore ကို အသုံးပြု၍ Python တွင် z-score များကို တွက်ချက်နိုင်သည်-
scipy.stats.zscore(a၊ axis=0၊ ddof=0၊ nan_policy=’propagate’)
ရွှေ-
- a : ဒေတာပါရှိသော array အမျိုးအစား အရာဝတ္ထုတစ်ခု
- ဝင်ရိုး : z-ရမှတ်များကို တွက်ချက်ရန် တစ်လျှောက် ဝင်ရိုး။ မူရင်းတန်ဖိုးသည် 0 ဖြစ်သည်။
- ddof : စံသွေဖည်မှုကို တွက်ချက်ရာတွင် လွတ်လပ်မှုဒီဂရီကို တည့်မတ်ခြင်း။ မူရင်းတန်ဖိုးသည် 0 ဖြစ်သည်။
- nan_policy : ထည့်သွင်းမှုတွင် nan ပါဝင်သည့်အခါ မည်သို့ကိုင်တွယ်ရမည်နည်း။ မူရင်းမှာ propagate ဖြစ်ပြီး၊ nan ကို ပြန်ပေးသည်။ ‘raise’ သည် error တက်လာပြီး ‘omit’ သည် nan value ကိုလျစ်လျူရှုကာ တွက်ချက်မှုများကို လုပ်ဆောင်သည်။
အောက်ဖော်ပြပါနမူနာများသည် တစ်ဘက်မြင်ဂဏန်းအခင်းအကျင်းများအတွက် z-ရမှတ်များကို တွက်ချက်ရန် ဤလုပ်ဆောင်ချက်ကိုအသုံးပြုပုံကို သရုပ်ဖော်ထားသည်။
ကိန်းဂဏန်းတစ်ဘက်မြင် ခင်းကျင်းမှုများ
အဆင့် 1: မော်ဂျူးများကို တင်သွင်းပါ။
import pandas as pd import numpy as np import scipy.stats as stats
အဆင့် 2: တန်ဖိုးများဇယားတစ်ခုဖန်တီးပါ။
data = np.array([6, 7, 7, 12, 13, 13, 15, 16, 19, 22])
အဆင့် 3- ဇယားရှိ တန်ဖိုးတစ်ခုစီအတွက် z-ရမှတ်များကို တွက်ချက်ပါ။
stats.zscore(data)
[-1.394, -1.195, -1.195, -0.199, 0, 0, 0.398, 0.598, 1.195, 1.793]
z-score တစ်ခုစီတွင် တစ်ဦးချင်းတန်ဖိုးသည် ပျမ်းမျှထံမှ စံသွေဖည်မှု မည်မျှရှိသည်ကို ပြောပြသည်။ ဥပမာအားဖြင့်:
- ဇယားရှိ “ 6” ၏ ပထမတန်ဖိုးသည် ပျမ်းမျှ အောက်ရှိ 1.394 စံသွေဖည်သည်။
- ဇယားရှိ “ 13” ၏ ပဉ္စမတန်ဖိုးသည် 0 စံသွေဖည်သည်၊ ဆိုလိုသည်မှာ ဆိုလိုသည်နှင့် ညီမျှသည်။
- ဇယားရှိ “ 22” ၏ နောက်ဆုံးတန်ဖိုးသည် ပျမ်းမျှ အထက် စံသွေဖည် 1.793 ဖြစ်သည်။
ဘက်ပေါင်းစုံ ကိန်းဂဏန်းများ
ကျွန်ုပ်တို့တွင် multidimensional array တစ်ခုရှိပါက၊ ၎င်း၏ကိုယ်ပိုင် array နှင့် သက်ဆိုင်သော z-score တစ်ခုစီကို တွက်ချက်လိုကြောင်း သတ်မှတ်ရန် ဝင်ရိုးဘောင် ဘောင်ကို အသုံးပြုနိုင်ပါသည်။ ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့တွင် အောက်ပါ multidimensional array ရှိသည်ဆိုပါစို့။
data = np.array([[5, 6, 7, 7, 8], [8, 8, 8, 9, 9], [2, 2, 4, 4, 5]])
ဇယားတစ်ခုစီအတွက် z-ရမှတ်များကို တွက်ချက်ရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။
stats.zscore(data, axis=1) [[-1.569 -0.588 0.392 0.392 1.373] [-0.816 -0.816 -0.816 1.225 1.225] [-1.167 -1.167 0.5 0.5 1.333]]
တန်ဖိုးတစ်ခုစီအတွက် z-ရမှတ်များကို ၎င်းတို့တွေ့ရှိသည့်ဇယားနှင့် နှိုင်းယှဉ်ပြသထားသည်။ ဥပမာအားဖြင့်:
- ပထမဇယားရှိ “ 5” ၏ပထမတန်ဖိုးသည် ၎င်း၏ဇယား၏ပျမ်းမျှ အောက်တွင် 1.159 စံသွေဖည်သည်။
- ဒုတိယဇယားရှိ “ 8” ၏ပထမတန်ဖိုးသည် ၎င်း၏ဇယား၏ပျမ်းမျှ အောက် 0.816 စံသွေဖီသည်။
- တတိယဇယားရှိ “ 2” ၏ပထမတန်ဖိုးသည် ၎င်း၏ဇယား၏ပျမ်းမျှ အောက်တွင် 1.167 စံသွေဖည်သည်။
Pandas ဒေတာဘောင်များ
၎င်းအစား ကျွန်ုပ်တို့တွင် Pandas DataFrame ရှိသည်ဟု ယူဆကြပါစို့။
data = pd.DataFrame(np.random.randint(0, 10, size=(5, 3)), columns=['A', 'B', 'C']) data ABC 0 8 0 9 1 4 0 7 2 9 6 8 3 1 8 1 4 8 0 8
ကော်လံတစ်ခုစီအတွက် တစ်ဦးချင်းတန်ဖိုးများ၏ z-score ကိုတွက်ချက်ရန် သက်ဆိုင်သည့် လုပ်ဆောင်ချက်ကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-
data.apply(stats.zscore) ABC 0 0.659380 -0.802955 0.836080 1 -0.659380 -0.802955 0.139347 2 0.989071 0.917663 0.487713 3 -1.648451 1.491202 -1.950852 4 0.659380 -0.802955 0.487713
တန်ဖိုးတစ်ခုစီအတွက် z-ရမှတ်များကို ၎င်းတို့တည်ရှိနေသည့် ကော်လံနှင့် နှိုင်းယှဉ်ပြသထားသည်။ ဥပမာအားဖြင့်:
- ပထမကော်လံရှိ “ 8” ၏ ပထမတန်ဖိုးသည် ၎င်း၏ကော်လံ၏ပျမ်းမျှတန်ဖိုး အထက် 0.659 စံသွေဖည်သည်။
- ဒုတိယကော်လံရှိ ပထမ “ 0” တန်ဖိုးသည် ၎င်း၏ကော်လံရှိ ပျမ်းမျှတန်ဖိုးထက် 0.803 စံသွေ ဖီ သည်။
- တတိယကော်လံရှိ “ 9” ၏ပထမတန်ဖိုးသည် ၎င်း၏ကော်လံ၏ပျမ်းမျှတန်ဖိုး အထက် 0.836 စံသွေဖည်သည်။
နောက်ထပ်အရင်းအမြစ်များ-
Excel တွင် Z ရမှတ်များတွက်ချက်နည်း
SPSS တွင် Z ရမှတ်များ တွက်နည်း
TI-84 ဂဏန်းတွက်စက်တွင် Z ရမှတ်များကို တွက်ချက်နည်း