Python တွင် point-biserial ဆက်စပ်မှုကို တွက်ချက်နည်း
Point-biserial အပြန်အလှန်ဆက်စပ်မှုကို binary variable၊ x နှင့် ဆက်တိုက်ကိန်းရှင် y တို့ကြား ဆက်နွယ်မှုကို တိုင်းတာရန် အသုံးပြုသည်။
Pearson ဆက်စပ်ကိန်းဂဏန်း နှင့်ဆင်တူသည်၊ point-biserial ဆက်စပ်ကိန်းသည် -1 နှင့် 1 ကြားရှိတန်ဖိုးကို ယူသည်-
- -1 သည် ကိန်းရှင်နှစ်ခုကြားတွင် လုံးဝအပျက်သဘောဆောင်သောဆက်စပ်မှုကို ညွှန်ပြသည်။
- 0 သည် ကိန်းရှင်နှစ်ခုကြားတွင် ဆက်စပ်မှုမရှိဟု ညွှန်ပြသည်။
- 1 သည် ကိန်းရှင်နှစ်ခုကြားတွင် လုံးဝအပြုသဘောဆောင်သော ဆက်စပ်မှုကို ညွှန်ပြသည်။
ဤသင်ခန်းစာတွင် Python ရှိ variable နှစ်ခုကြား point-biserial ဆက်စပ်မှုကို တွက်ချက်နည်းကို ရှင်းပြထားသည်။
ဥပမာ- Python ရှိ point-biserial ဆက်စပ်မှု
ကျွန်ုပ်တို့တွင် binary variable၊ x နှင့် ဆက်တိုက်ကိန်းရှင် y ရှိသည်ဆိုပါစို့။
x = [0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0] y = [12, 14, 17, 17, 11, 22, 23, 11, 19, 8, 12]
ကိန်းရှင်နှစ်ခုကြားရှိ point-biserial ဆက်စပ်မှုကို တွက်ချက်ရန် scipy.stats စာကြည့်တိုက်မှ pointbiserialr() လုပ်ဆောင်ချက်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်ပါသည်။
ဤလုပ်ဆောင်ချက်သည် သက်ဆိုင်ရာ p-value နှင့်အတူ ဆက်စပ်ဆက်စပ်ကိန်းကို ပြန်ပေးကြောင်း သတိပြုပါ။
import scipy.stats as stats #calculate point-biserial correlation stats. pointbiserialr (x,y) PointbiserialrResult(correlation=0.21816, pvalue=0.51928)
point-biserial ဆက်စပ်ကိန်းသည် 0.21816 ဖြစ်ပြီး သက်ဆိုင်ရာ p-value သည် 0.51928 ဖြစ်သည်။
ဆက်စပ်ဆက်စပ်ကိန်းသည် အပြုသဘောဖြစ်သောကြောင့်၊ variable x သည် တန်ဖိုး “ 1” ကို ယူသောအခါ၊ variable y သည် variable x ၏တန်ဖိုး “ 0” ကိုယူသောအခါထက် တန်ဖိုးပိုမိုမြင့်မားသည်ကို ညွှန်ပြပါသည်။
ဤဆက်စပ်ဆက်နွယ်မှု၏ p-တန်ဖိုးသည် 0.05 ထက်မနည်းသောကြောင့်၊ ဤဆက်စပ်ဆက်နွယ်မှုသည် ကိန်းဂဏန်းအရ သိသာထင်ရှားခြင်းမရှိပါ။
scipy.stats documentation တွင် ဤဆက်စပ်မှုကို တွက်ချက်ပုံ၏ အတိအကျအသေးစိတ်အချက်အလက်များကို သင်တွေ့နိုင်သည် ။