Python တွင် correlation test ကိုမည်သို့လုပ်ဆောင်နည်း (ဥပမာနှင့်အတူ)


variable နှစ်ခုကြားရှိ ဆက်စပ်မှုကို တိုင်းတာရန် နည်းလမ်းတစ်ခုမှာ Pearson correlation coefficient ကို အသုံးပြုပြီး၊ variable နှစ်ခုကြားရှိ linear ဆက်စပ်မှုကို တိုင်းတာသည့် နည်းလမ်းတစ်ခုဖြစ်သည်

၎င်းသည် အမြဲတမ်း -1 နှင့် 1 အကြား တန်ဖိုးတစ်ခုကို ယူသည်-

  • -1 သည် လုံးဝအနုတ်လက္ခဏာ မျဉ်းကြောင်းဆက်စပ်မှုကို ညွှန်ပြသည်။
  • 0 သည် linear ဆက်စပ်မှုမရှိသည်ကို ညွှန်ပြသည်။
  • 1 သည် လုံးဝအပြုသဘောဆောင်သော linear ဆက်စပ်မှုကို ညွှန်ပြသည်။

ဆက်စပ်ကိန်းဂဏန်းတစ်ခုသည် ကိန်းဂဏန်းအရ သိသာထင်ရှားမှုရှိမရှိ ဆုံးဖြတ်ရန်၊ သက်ဆိုင်ရာ t-score နှင့် p-value ကို တွက်ချက်နိုင်သည်။

ဆက်စပ်ပေါင်းကိန်း (r) ၏ t-score ကို တွက်ချက်ရန် ဖော်မြူလာမှာ-

t = r * √ n-2 / √ 1-r 2

ထို့နောက် p-value ကို လွတ်လပ်မှု၏ n-2 ဒီဂရီဖြင့် t-distribution အတွက် သက်ဆိုင်ရာ အမြီးနှစ်ကောင် p-value အဖြစ် တွက်ချက်သည်။

ဥပမာ- Python တွင် Correlation Test

ကိန်းရှင်နှစ်ခုကြားရှိ ဆက်စပ်ကိန်းကို ကိန်းဂဏန်းအရ သိသာထင်ရှားစွာ ဆုံးဖြတ်ရန်၊ SciPy စာကြည့်တိုက်မှ pearsonr လုပ်ဆောင်ချက်ကို အသုံးပြု၍ Python တွင် ဆက်စပ်စမ်းသပ်မှုကို လုပ်ဆောင်နိုင်သည်။

ဤလုပ်ဆောင်ချက်သည် ကိန်းရှင်နှစ်ခုကြားရှိ ဆက်စပ်ကိန်းကို ပြန်ပေးသည်နှင့် အမြီးနှစ်ကြောင်းရှိသော p-တန်ဖိုးကို ပြန်ပေးသည်။

ဥပမာအားဖြင့်၊ Python တွင် အောက်ပါဇယားနှစ်ခုရှိသည် ဆိုပါစို့။

 #create two arrays
x = [3, 4, 4, 5, 7, 8, 10, 12, 13, 15]
y = [2, 4, 4, 5, 4, 7, 8, 19, 14, 10]

ကျွန်ုပ်တို့သည် pearsonr လုပ်ဆောင်ချက်ကို တင်သွင်းနိုင်ပြီး ဇယားနှစ်ခုကြားရှိ Pearson ဆက်စပ်ကိန်းကို တွက်ချက်နိုင်သည်-

 from scipy. stats . stats import pearsonr

#calculation correlation coefficient and p-value between x and y
pearsonr(x, y)

(0.8076177030748631, 0.004717255828132089)

ဤသည်မှာ ရလဒ်ကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်-

  • Pearson ဆက်စပ်ကိန်း(r): 0.8076
  • နှစ်ဘက် p-တန်ဖိုး- 0.0047

ဆက်စပ်ကိန်းသည် 1 နှင့် နီးကပ်နေသည်၊ ၎င်းသည် ကိန်းရှင်နှစ်ခုကြားတွင် အပြုသဘောဆောင်သော ဆက်စပ်မှုရှိကြောင်း ကျွန်ုပ်တို့ကိုပြောပြသည်။

ဆက်စပ် p-value သည် 0.05 ထက်နည်းသောကြောင့်၊ ကိန်းရှင်နှစ်ခုကြားတွင် စာရင်းအင်းဆိုင်ရာ သိသာထင်ရှားသောဆက်စပ်မှုရှိကြောင်း ကျွန်ုပ်တို့ကောက်ချက်ချပါသည်။

pearson function မှ တစ်ဦးချင်း ဆက်စပ်ကိန်းကို နှင့် p-value ကိုလည်း ထုတ်ယူနိုင်သည်ကို သတိပြုပါ။

 #extract correlation coefficient (rounded to 4 decimal places)
r = round(pearsonr(x, y)[ 0 ], 4)

print (r)

0.8076

#extract p-value (rounded to 4 decimal places) 
p = round(pearsonr(x, y)[ 1 ], 4)

print (p) 

0.0047

ဤတန်ဖိုးများသည် မူရင်း pearsonr လုပ်ဆောင်ချက်၏ output နှင့် နှိုင်းယှဉ်လျှင် အနည်းငယ်ပိုမိုလွယ်ကူပါသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ဆက်စပ်ကိန်းများအကြောင်း နောက်ထပ်အချက်အလက်များကို ပေးဆောင်သည်-

Pearson Correlation Coefficient နိဒါန်း
အဘယ်အရာကို “ ခိုင်မာသော” ဆက်စပ်မှုဟုယူဆသနည်း။
Pearson ၏ဆက်စပ်မှု၏ယူဆချက်ငါးခု

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်