Continuous နှင့် categorical variables များကြား ဆက်စပ်မှုကို တွက်ချက်နည်း


ကျွန်ုပ်တို့သည် စဉ်ဆက်မပြတ်ကိန်းရှင်နှစ်ခုကြားရှိ ဆက်စပ်မှုကို တွက်ချက်လိုသောအခါ၊ ယေဘူယျအားဖြင့် Pearson correlation coefficient ကို အသုံးပြုပါသည်။

သို့သော်၊ စဉ်ဆက်မပြတ်ကိန်းရှင်နှင့် categorical variable အ ကြားဆက်စပ်မှုကို တွက်ချက်လိုပါက point biserial correlation ဟုခေါ်သောအရာကို ကျွန်ုပ်တို့သုံးနိုင်သည်။

Point biserial correlation ကို binary categorical variable (တန်ဖိုးနှစ်ခုသာယူနိုင်သော variable) နှင့် စဉ်ဆက်မပြတ် variable နှင့် အောက်ပါဂုဏ်သတ္တိများအကြား ဆက်စပ်မှုကို တွက်ချက်ရန် အသုံးပြုသည်-

  • point-biserial ဆက်စပ်မှုမှာ -1 နှင့် 1 ကြား ကွဲပြားနိုင်သည်။
  • binary variable မှ ဖန်တီးထားသော အုပ်စုတစ်ခုစီအတွက်၊ စဉ်ဆက်မပြတ်ကိန်းရှင်ကို ပုံမှန်အားဖြင့် တူညီသောကွဲလွဲမှုများဖြင့် ဖြန့်ဝေသည်ဟု ယူဆပါသည်။
  • binary variable မှ ဖန်တီးထားသော အုပ်စုတစ်ခုစီအတွက်၊ အစွန်းရောက် outliers များမရှိဟု ယူဆပါသည်။

အောက်ဖော်ပြပါ ဥပမာသည် လက်တွေ့တွင် point-biserial ဆက်စပ်မှုကို တွက်ချက်နည်းကို ပြသထားသည်။

ဥပမာ- point-biserial ဆက်စပ်မှုကို တွက်ချက်ခြင်း။

တက္ကသိုလ်ပါမောက္ခတစ်ဦးသည် အရည်အချင်းစစ်စာမေးပွဲတစ်ခုတွင် လိင်နှင့်ရမှတ်ကြား ဆက်စပ်မှုရှိမရှိ ဆုံးဖြတ်လိုသည်ဆိုပါစို့။

သူ့အတန်းထဲက ယောက်ျားလေး ၁၂ ယောက်နဲ့ မိန်းကလေး ၁၂ ယောက်အတွက် အောက်ပါ အချက်အလက်တွေကို စုဆောင်းတယ်။

ကျား၊မ သည် အမျိုးအစားခွဲခြားနိုင်သော ကိန်းရှင်တစ်ခုဖြစ်ပြီး ရမှတ် သည် စဉ်ဆက်မပြတ်ကိန်းရှင်ဖြစ်သောကြောင့်၊ ကိန်းရှင်နှစ်ခုကြားရှိ point-biserial ဆက်စပ်မှုကို တွက်ချက်ရန် အဓိပ္ပာယ်ရှိပါသည်။

ပါမောက္ခသည် ကိန်းရှင်နှစ်ခုကြားရှိ point-biserial ဆက်စပ်မှုကို တွက်ချက်ရန် Excel၊ R၊ Python၊ SPSS၊ Stata အပါအဝင် မည်သည့် ကိန်းဂဏန်းဆိုင်ရာဆော့ဖ်ဝဲကိုမဆို အသုံးပြုနိုင်သည်။

အောက်ဖော်ပြပါ ကုဒ်သည် ကျားမကွဲပြားမှုအတွက် အမျိုးသားများကို ကိုယ်စားပြုရန်အတွက် 0 တန်ဖိုးကို အသုံးပြု၍ R တွင် point-biserial ဆက်စပ်မှုကို တွက်ချက်နည်းကို ပြသသည်-

 #define values for gender
gender <- c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
            1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1)

#define values for score
score <- c(77, 78, 79, 79, 82, 84, 85, 88, 89, 91, 91, 94,
           84, 84, 84, 85, 85, 86, 86, 86, 89, 91, 94, 98)

#calculate point-biserial correlation
horn. test (gender, score)

	Pearson's product-moment correlation

data: gender and score
t = 1.3739, df = 22, p-value = 0.1833
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.1379386 0.6147832
sample estimates:
      horn 
0.2810996

ရလဒ်မှ၊ point-biserial ဆက်စပ်ကိန်းသည် 0.281 ဖြစ်ပြီး သက်ဆိုင်ရာ p-value သည် 0.1833 ဖြစ်သည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။

ဆက်စပ်ဖော်ကိန်းသည် အပြုသဘောဖြစ်သောကြောင့်၊ ၎င်းသည် ကျား၊မနှင့် ရမှတ်ကြားတွင် အပြုသဘောဆောင်သောဆက်စပ်ဆက်နွယ်မှုရှိကြောင်း ကျွန်ုပ်တို့ကိုပြောပြသည်။

ကျွန်ုပ်တို့သည် အမျိုးသားများကို 1 အဖြစ် နှင့် အမျိုးသမီး 0 အဖြစ် ကုဒ်လုပ်ထားသောကြောင့်၊ ဤအချက်သည် အမျိုးသားများအတွက် ရမှတ်များ ပိုမိုမြင့်မားလေ့ရှိသည် (ဆိုလိုသည်မှာ ကျား-မ တိုးလာသည်နှင့်အမျှ ရမှတ်များ တိုးတတ်သည်)။ » 0 မှ 1)။

သို့သော်လည်း p-value သည် 0.05 ထက်မနည်းသောကြောင့်၊ ဤဆက်စပ်ကိန်းဂဏန်းသည် ကိန်းဂဏန်းအရ သိသာထင်ရှားခြင်းမရှိပါ။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် မတူညီသော စာရင်းအင်းဆော့ဖ်ဝဲကို အသုံးပြု၍ point biserial ဆက်စပ်မှုကို တွက်ချက်နည်းကို ရှင်းပြသည်-

Excel တွင် point-biserial ဆက်စပ်မှုကို တွက်ချက်နည်း
R တွင် point-biserial ဆက်စပ်မှုကို တွက်နည်း
Python တွင် point-biserial ဆက်စပ်မှုကို တွက်ချက်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်