Continuous နှင့် categorical variables များကြား ဆက်စပ်မှုကို တွက်ချက်နည်း
ကျွန်ုပ်တို့သည် စဉ်ဆက်မပြတ်ကိန်းရှင်နှစ်ခုကြားရှိ ဆက်စပ်မှုကို တွက်ချက်လိုသောအခါ၊ ယေဘူယျအားဖြင့် Pearson correlation coefficient ကို အသုံးပြုပါသည်။
သို့သော်၊ စဉ်ဆက်မပြတ်ကိန်းရှင်နှင့် categorical variable အ ကြားဆက်စပ်မှုကို တွက်ချက်လိုပါက point biserial correlation ဟုခေါ်သောအရာကို ကျွန်ုပ်တို့သုံးနိုင်သည်။
Point biserial correlation ကို binary categorical variable (တန်ဖိုးနှစ်ခုသာယူနိုင်သော variable) နှင့် စဉ်ဆက်မပြတ် variable နှင့် အောက်ပါဂုဏ်သတ္တိများအကြား ဆက်စပ်မှုကို တွက်ချက်ရန် အသုံးပြုသည်-
- point-biserial ဆက်စပ်မှုမှာ -1 နှင့် 1 ကြား ကွဲပြားနိုင်သည်။
- binary variable မှ ဖန်တီးထားသော အုပ်စုတစ်ခုစီအတွက်၊ စဉ်ဆက်မပြတ်ကိန်းရှင်ကို ပုံမှန်အားဖြင့် တူညီသောကွဲလွဲမှုများဖြင့် ဖြန့်ဝေသည်ဟု ယူဆပါသည်။
- binary variable မှ ဖန်တီးထားသော အုပ်စုတစ်ခုစီအတွက်၊ အစွန်းရောက် outliers များမရှိဟု ယူဆပါသည်။
အောက်ဖော်ပြပါ ဥပမာသည် လက်တွေ့တွင် point-biserial ဆက်စပ်မှုကို တွက်ချက်နည်းကို ပြသထားသည်။
ဥပမာ- point-biserial ဆက်စပ်မှုကို တွက်ချက်ခြင်း။
တက္ကသိုလ်ပါမောက္ခတစ်ဦးသည် အရည်အချင်းစစ်စာမေးပွဲတစ်ခုတွင် လိင်နှင့်ရမှတ်ကြား ဆက်စပ်မှုရှိမရှိ ဆုံးဖြတ်လိုသည်ဆိုပါစို့။
သူ့အတန်းထဲက ယောက်ျားလေး ၁၂ ယောက်နဲ့ မိန်းကလေး ၁၂ ယောက်အတွက် အောက်ပါ အချက်အလက်တွေကို စုဆောင်းတယ်။

ကျား၊မ သည် အမျိုးအစားခွဲခြားနိုင်သော ကိန်းရှင်တစ်ခုဖြစ်ပြီး ရမှတ် သည် စဉ်ဆက်မပြတ်ကိန်းရှင်ဖြစ်သောကြောင့်၊ ကိန်းရှင်နှစ်ခုကြားရှိ point-biserial ဆက်စပ်မှုကို တွက်ချက်ရန် အဓိပ္ပာယ်ရှိပါသည်။
ပါမောက္ခသည် ကိန်းရှင်နှစ်ခုကြားရှိ point-biserial ဆက်စပ်မှုကို တွက်ချက်ရန် Excel၊ R၊ Python၊ SPSS၊ Stata အပါအဝင် မည်သည့် ကိန်းဂဏန်းဆိုင်ရာဆော့ဖ်ဝဲကိုမဆို အသုံးပြုနိုင်သည်။
အောက်ဖော်ပြပါ ကုဒ်သည် ကျားမကွဲပြားမှုအတွက် အမျိုးသားများကို ကိုယ်စားပြုရန်အတွက် 0 တန်ဖိုးကို အသုံးပြု၍ R တွင် point-biserial ဆက်စပ်မှုကို တွက်ချက်နည်းကို ပြသသည်-
#define values for gender gender <- c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1) #define values for score score <- c(77, 78, 79, 79, 82, 84, 85, 88, 89, 91, 91, 94, 84, 84, 84, 85, 85, 86, 86, 86, 89, 91, 94, 98) #calculate point-biserial correlation horn. test (gender, score) Pearson's product-moment correlation data: gender and score t = 1.3739, df = 22, p-value = 0.1833 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: -0.1379386 0.6147832 sample estimates: horn 0.2810996
ရလဒ်မှ၊ point-biserial ဆက်စပ်ကိန်းသည် 0.281 ဖြစ်ပြီး သက်ဆိုင်ရာ p-value သည် 0.1833 ဖြစ်သည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။
ဆက်စပ်ဖော်ကိန်းသည် အပြုသဘောဖြစ်သောကြောင့်၊ ၎င်းသည် ကျား၊မနှင့် ရမှတ်ကြားတွင် အပြုသဘောဆောင်သောဆက်စပ်ဆက်နွယ်မှုရှိကြောင်း ကျွန်ုပ်တို့ကိုပြောပြသည်။
ကျွန်ုပ်တို့သည် အမျိုးသားများကို 1 အဖြစ် နှင့် အမျိုးသမီး 0 အဖြစ် ကုဒ်လုပ်ထားသောကြောင့်၊ ဤအချက်သည် အမျိုးသားများအတွက် ရမှတ်များ ပိုမိုမြင့်မားလေ့ရှိသည် (ဆိုလိုသည်မှာ ကျား-မ တိုးလာသည်နှင့်အမျှ ရမှတ်များ တိုးတတ်သည်)။ » 0 မှ 1)။
သို့သော်လည်း p-value သည် 0.05 ထက်မနည်းသောကြောင့်၊ ဤဆက်စပ်ကိန်းဂဏန်းသည် ကိန်းဂဏန်းအရ သိသာထင်ရှားခြင်းမရှိပါ။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် မတူညီသော စာရင်းအင်းဆော့ဖ်ဝဲကို အသုံးပြု၍ point biserial ဆက်စပ်မှုကို တွက်ချက်နည်းကို ရှင်းပြသည်-
Excel တွင် point-biserial ဆက်စပ်မှုကို တွက်ချက်နည်း
R တွင် point-biserial ဆက်စပ်မှုကို တွက်နည်း
Python တွင် point-biserial ဆက်စပ်မှုကို တွက်ချက်နည်း