Python တွင် correlation test ကိုမည်သို့လုပ်ဆောင်နည်း (ဥပမာနှင့်အတူ)
variable နှစ်ခုကြားရှိ ဆက်စပ်မှုကို တိုင်းတာရန် နည်းလမ်းတစ်ခုမှာ Pearson correlation coefficient ကို အသုံးပြုပြီး၊ variable နှစ်ခုကြားရှိ linear ဆက်စပ်မှုကို တိုင်းတာသည့် နည်းလမ်းတစ်ခုဖြစ်သည် ။
၎င်းသည် အမြဲတမ်း -1 နှင့် 1 အကြား တန်ဖိုးတစ်ခုကို ယူသည်-
- -1 သည် လုံးဝအနုတ်လက္ခဏာ မျဉ်းကြောင်းဆက်စပ်မှုကို ညွှန်ပြသည်။
- 0 သည် linear ဆက်စပ်မှုမရှိသည်ကို ညွှန်ပြသည်။
- 1 သည် လုံးဝအပြုသဘောဆောင်သော linear ဆက်စပ်မှုကို ညွှန်ပြသည်။
ဆက်စပ်ကိန်းဂဏန်းတစ်ခုသည် ကိန်းဂဏန်းအရ သိသာထင်ရှားမှုရှိမရှိ ဆုံးဖြတ်ရန်၊ သက်ဆိုင်ရာ t-score နှင့် p-value ကို တွက်ချက်နိုင်သည်။
ဆက်စပ်ပေါင်းကိန်း (r) ၏ t-score ကို တွက်ချက်ရန် ဖော်မြူလာမှာ-
t = r * √ n-2 / √ 1-r 2
ထို့နောက် p-value ကို လွတ်လပ်မှု၏ n-2 ဒီဂရီဖြင့် t-distribution အတွက် သက်ဆိုင်ရာ အမြီးနှစ်ကောင် p-value အဖြစ် တွက်ချက်သည်။
ဥပမာ- Python တွင် Correlation Test
ကိန်းရှင်နှစ်ခုကြားရှိ ဆက်စပ်ကိန်းကို ကိန်းဂဏန်းအရ သိသာထင်ရှားစွာ ဆုံးဖြတ်ရန်၊ SciPy စာကြည့်တိုက်မှ pearsonr လုပ်ဆောင်ချက်ကို အသုံးပြု၍ Python တွင် ဆက်စပ်စမ်းသပ်မှုကို လုပ်ဆောင်နိုင်သည်။
ဤလုပ်ဆောင်ချက်သည် ကိန်းရှင်နှစ်ခုကြားရှိ ဆက်စပ်ကိန်းကို ပြန်ပေးသည်နှင့် အမြီးနှစ်ကြောင်းရှိသော p-တန်ဖိုးကို ပြန်ပေးသည်။
ဥပမာအားဖြင့်၊ Python တွင် အောက်ပါဇယားနှစ်ခုရှိသည် ဆိုပါစို့။
#create two arrays
x = [3, 4, 4, 5, 7, 8, 10, 12, 13, 15]
y = [2, 4, 4, 5, 4, 7, 8, 19, 14, 10]
ကျွန်ုပ်တို့သည် pearsonr လုပ်ဆောင်ချက်ကို တင်သွင်းနိုင်ပြီး ဇယားနှစ်ခုကြားရှိ Pearson ဆက်စပ်ကိန်းကို တွက်ချက်နိုင်သည်-
from scipy. stats . stats import pearsonr #calculation correlation coefficient and p-value between x and y pearsonr(x, y) (0.8076177030748631, 0.004717255828132089)
ဤသည်မှာ ရလဒ်ကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်-
- Pearson ဆက်စပ်ကိန်း(r): 0.8076
- နှစ်ဘက် p-တန်ဖိုး- 0.0047
ဆက်စပ်ကိန်းသည် 1 နှင့် နီးကပ်နေသည်၊ ၎င်းသည် ကိန်းရှင်နှစ်ခုကြားတွင် အပြုသဘောဆောင်သော ဆက်စပ်မှုရှိကြောင်း ကျွန်ုပ်တို့ကိုပြောပြသည်။
ဆက်စပ် p-value သည် 0.05 ထက်နည်းသောကြောင့်၊ ကိန်းရှင်နှစ်ခုကြားတွင် စာရင်းအင်းဆိုင်ရာ သိသာထင်ရှားသောဆက်စပ်မှုရှိကြောင်း ကျွန်ုပ်တို့ကောက်ချက်ချပါသည်။
pearson function မှ တစ်ဦးချင်း ဆက်စပ်ကိန်းကို နှင့် p-value ကိုလည်း ထုတ်ယူနိုင်သည်ကို သတိပြုပါ။
#extract correlation coefficient (rounded to 4 decimal places) r = round(pearsonr(x, y)[ 0 ], 4) print (r) 0.8076 #extract p-value (rounded to 4 decimal places) p = round(pearsonr(x, y)[ 1 ], 4) print (p) 0.0047
ဤတန်ဖိုးများသည် မူရင်း pearsonr လုပ်ဆောင်ချက်၏ output နှင့် နှိုင်းယှဉ်လျှင် အနည်းငယ်ပိုမိုလွယ်ကူပါသည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ဆက်စပ်ကိန်းများအကြောင်း နောက်ထပ်အချက်အလက်များကို ပေးဆောင်သည်-
Pearson Correlation Coefficient နိဒါန်း
အဘယ်အရာကို “ ခိုင်မာသော” ဆက်စပ်မှုဟုယူဆသနည်း။
Pearson ၏ဆက်စပ်မှု၏ယူဆချက်ငါးခု