Python တွင် point-biserial ဆက်စပ်မှုကို တွက်ချက်နည်း


Point-biserial အပြန်အလှန်ဆက်စပ်မှုကို binary variable၊ x နှင့် ဆက်တိုက်ကိန်းရှင် y တို့ကြား ဆက်နွယ်မှုကို တိုင်းတာရန် အသုံးပြုသည်။

Pearson ဆက်စပ်ကိန်းဂဏန်း နှင့်ဆင်တူသည်၊ point-biserial ဆက်စပ်ကိန်းသည် -1 နှင့် 1 ကြားရှိတန်ဖိုးကို ယူသည်-

  • -1 သည် ကိန်းရှင်နှစ်ခုကြားတွင် လုံးဝအပျက်သဘောဆောင်သောဆက်စပ်မှုကို ညွှန်ပြသည်။
  • 0 သည် ကိန်းရှင်နှစ်ခုကြားတွင် ဆက်စပ်မှုမရှိဟု ညွှန်ပြသည်။
  • 1 သည် ကိန်းရှင်နှစ်ခုကြားတွင် လုံးဝအပြုသဘောဆောင်သော ဆက်စပ်မှုကို ညွှန်ပြသည်။

ဤသင်ခန်းစာတွင် Python ရှိ variable နှစ်ခုကြား point-biserial ဆက်စပ်မှုကို တွက်ချက်နည်းကို ရှင်းပြထားသည်။

ဥပမာ- Python ရှိ point-biserial ဆက်စပ်မှု

ကျွန်ုပ်တို့တွင် binary variable၊ x နှင့် ဆက်တိုက်ကိန်းရှင် y ရှိသည်ဆိုပါစို့။

 x = [0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0]
y = [12, 14, 17, 17, 11, 22, 23, 11, 19, 8, 12]

ကိန်းရှင်နှစ်ခုကြားရှိ point-biserial ဆက်စပ်မှုကို တွက်ချက်ရန် scipy.stats စာကြည့်တိုက်မှ pointbiserialr() လုပ်ဆောင်ချက်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်ပါသည်။

ဤလုပ်ဆောင်ချက်သည် သက်ဆိုင်ရာ p-value နှင့်အတူ ဆက်စပ်ဆက်စပ်ကိန်းကို ပြန်ပေးကြောင်း သတိပြုပါ။

 import scipy.stats as stats

#calculate point-biserial correlation
stats. pointbiserialr (x,y)

PointbiserialrResult(correlation=0.21816, pvalue=0.51928)

point-biserial ဆက်စပ်ကိန်းသည် 0.21816 ဖြစ်ပြီး သက်ဆိုင်ရာ p-value သည် 0.51928 ဖြစ်သည်။

ဆက်စပ်ဆက်စပ်ကိန်းသည် အပြုသဘောဖြစ်သောကြောင့်၊ variable x သည် တန်ဖိုး “ 1” ကို ယူသောအခါ၊ variable y သည် variable x ၏တန်ဖိုး “ 0” ကိုယူသောအခါထက် တန်ဖိုးပိုမိုမြင့်မားသည်ကို ညွှန်ပြပါသည်။

ဤဆက်စပ်ဆက်နွယ်မှု၏ p-တန်ဖိုးသည် 0.05 ထက်မနည်းသောကြောင့်၊ ဤဆက်စပ်ဆက်နွယ်မှုသည် ကိန်းဂဏန်းအရ သိသာထင်ရှားခြင်းမရှိပါ။

scipy.stats documentation တွင် ဤဆက်စပ်မှုကို တွက်ချက်ပုံ၏ အတိအကျအသေးစိတ်အချက်အလက်များကို သင်တွေ့နိုင်သည်

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်