Categorical variable များကြား ဆက်စပ်မှုကို တွက်ချက်နည်း


စဉ်ဆက်မပြတ် ကိန်းသေကိန်းရှင်များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် Pearson correlation coefficient ကို ကျွန်ုပ်တို့ အသုံးပြုလေ့ရှိသည်။

သို့သော်၊ အမည်များ သို့မဟုတ် အညွှန်းများကဲ့သို့သော အမျိုးအစားခွဲကိန်းရှင်များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် မတူညီသော မက်ထရစ်ကို အသုံးပြုရန် လိုအပ်ပါသည်။

  • အိမ်ထောင်ရေးအခြေအနေ (လူပျို၊ အိမ်ထောင်၊ ကွာရှင်း)
  • ဆေးလိပ်သောက်ခြင်းအခြေအနေ (ဆေးလိပ်သောက်သူ၊ ဆေးလိပ်မသောက်သူ)
  • မျက်လုံးအရောင် (အပြာ၊ အညို၊ အစိမ်း)

categorical variables များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် အသုံးများသော အတိုင်းအတာ သုံးခု ရှိပါသည်။

1. Tetrachoric ဆက်စပ်မှု- binary categorical variables များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် အသုံးပြုသည်။

2. Polychoric ဆက်စပ်မှု- သာမာန် အမျိုးအစားအလိုက် ကိန်းရှင်များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် အသုံးပြုသည်။

3. Cramer’s V- အမည်ခံ အမျိုးအစားအလိုက် ကိန်းရှင်များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် အသုံးပြုသည်။

အောက်ဖော်ပြပါ ကဏ္ဍများသည် ဤတိုင်းတာမှု သုံးခုမှ တစ်ခုစီကို တွက်ချက်နည်း ဥပမာတစ်ခု ပေးပါသည်။

မက်ထရစ် ၁- Tetrachoric ဆက်စပ်မှု

Tetrachoric correlation ကို binary categorical variables များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် အသုံးပြုသည်။ binary variable များသည် ဖြစ်နိုင်သည့်တန်ဖိုးနှစ်ခုမှ တစ်ခုသာယူနိုင်သော variable များဖြစ်ကြောင်း သတိရပါ။

tetrachoric ဆက်စပ်မှုတန်ဖိုးသည် -1 မှ 1 အထိ ကွာဟပြီး -1 သည် ပြင်းထန်သော အနုတ်လက္ခဏာဆက်စပ်မှုကို ညွှန်ပြသည်၊ 0 သည် ဆက်နွယ်မှုမရှိခြင်းကို ညွှန်ပြပြီး 1 သည် ခိုင်မာသောအပြုသဘောဆက်စပ်မှုကို ညွှန်ပြသည်။

ဥပမာအားဖြင့်၊ နိုင်ငံရေး ပါတီတစ်ခုအတွက် ဦးစားပေးမှုတွင် ကျား၊မ ဆက်စပ်မှုရှိ၊ မရှိ သိလိုသည်ဆိုပါစို့။ ဒါကြောင့် မဲဆန္ဒရှင် ၁၀၀ ရဲ့ ရိုးရှင်းတဲ့ ကျပန်းနမူနာကိုယူပြီး နိုင်ငံရေးပါတီတစ်ခုအတွက် သူတို့ရဲ့ လိုလားချက်တွေကို မေးမြန်းပါ။

အောက်ပါဇယားသည် စစ်တမ်း၏ရလဒ်များကို ဖော်ပြသည်။

Tetrachoric ဆက်စပ်မှု

categorical variable တစ်ခုစီသည် binary ဖြစ်ပြီး၊ ဆိုလိုသည်မှာ၊ variable တစ်ခုစီသည် ဖြစ်နိုင်သော value နှစ်ခုသာ ယူနိုင်သောကြောင့် ဤအခြေအနေတွင် tetrachoric ဆက်စပ်မှုကို ကျွန်ုပ်တို့ အသုံးပြုပါမည်။

variable နှစ်ခုကြားရှိ tetrachoric ဆက်စပ်မှုကို တွက်ချက်ရန် R တွင် အောက်ပါကုဒ်ကို အသုံးပြုနိုင်သည်။

 library (psych)

#create 2x2 table
data = matrix(c(19, 12, 30, 39), nrow= 2 )

#view table
data

#calculate tetrachoric correlation
tetrachoric(data)

tetrachoric correlation 
[1] 0.27

tetrachoric ဆက်စပ်ဆက်နွယ်မှုသည် 0.27 ဖြစ်လာသည်။ ဤတန်ဖိုးသည် အလွန်နိမ့်ကျပြီး ကျား၊မ နှင့် နိုင်ငံရေး ပါတီနှစ်ခြိုက်မှုကြားတွင် အားနည်းခြင်း (ရှိပါက) ပေါင်းသင်းမှုရှိကြောင်း ညွှန်ပြပါသည်။

မက်ထရစ် 2- Polychoric ဆက်စပ်မှု

Polychoric correlation ကို ordinal categorical variables များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် အသုံးပြုသည်။ သာမာန်ကိန်းရှင်များသည် ဖြစ်နိုင်ချေတန်ဖိုးများ သဘာဝအစီအစဥ်ရှိသည့် ကိန်းရှင်များဖြစ်ကြောင်း သတိရပါ။

polychoric ဆက်စပ်မှုတန်ဖိုးသည် -1 မှ 1 မှ ကွာဟပြီး -1 သည် ပြင်းထန်သော အနုတ်လက္ခဏာဆက်စပ်မှုကို ညွှန်ပြသည်၊ 0 သည် ဆက်စပ်မှုမရှိသည်ကို ညွှန်ပြပြီး 1 သည် ခိုင်မာသောအပြုသဘောဆက်စပ်မှုကို ညွှန်ပြသည်။

ဥပမာအားဖြင့်၊ မတူညီသောရုပ်ရှင်အဆင့်သတ်မှတ်ချက်အေဂျင်စီနှစ်ခုသည် ၎င်းတို့၏ရုပ်ရှင်အဆင့်သတ်မှတ်ချက်များကြား မြင့်မားသောဆက်စပ်မှုရှိမရှိကို သင်သိလိုသည်ဆိုကြပါစို့။

အေဂျင်စီတစ်ခုစီအား 1 မှ 3 အတိုင်းအတာဖြင့် မတူညီသောရုပ်ရှင် 20 ကို အဆင့်သတ်မှတ်ရန် 1 က “ ဆိုး” ၊ 2 “ ဆင်းရဲ” နှင့် 3 က “ ကောင်း” ကိုဖော်ပြရန် ကျွန်ုပ်တို့တောင်းဆိုပါသည်။

အောက်ပါဇယားသည် ရလဒ်များကို ပြသသည်-

အေဂျင်စီနှစ်ခု၏ အဆင့်သတ်မှတ်ချက်များကြားတွင် polychoric ဆက်စပ်မှုကို တွက်ချက်ရန် R တွင် အောက်ပါကုဒ်ကို အသုံးပြုနိုင်သည်။

 library (polycor)

#define movie ratings
x <- c(1, 1, 2, 2, 3, 2, 2, 3, 2, 3, 3, 2, 1, 2, 2, 1, 1, 1, 2, 2)
y <- c(1, 1, 2, 1, 3, 3, 3, 2, 2, 3, 3, 3, 2, 2, 2, 1, 2, 1, 3, 3)

#calculate polychoric correlation between ratings
polychor(x, y)

[1] 0.7828328

polychoric ဆက်စပ်ဆက်နွယ်မှုသည် 0.78 ဖြစ်လာသည်။ ဤတန်ဖိုးသည် အလွန်မြင့်မားပြီး အေဂျင်စီတစ်ခုစီ၏ အဆင့်သတ်မှတ်ချက်များကြားတွင် အပြုသဘောဆောင်သော ဆက်စပ်မှုရှိကြောင်း ညွှန်ပြပါသည်။

မက်ထရစ် 3- Cramer’s V

Cramer’s V ကို nominal categorical variables များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် အသုံးပြုသည်။ Nominal variable များသည် အမျိုးအစားအညွှန်းများကို ဆောင်ထားသော်လည်း သဘာဝအမှာစာမရှိကြောင်း မှတ်သားထားပါ။

Cramer’s V ၏တန်ဖိုးသည် 0 မှ 1 အထိ ကွာသည်၊ 0 သည် ကိန်းရှင်များကြားတွင် ဆက်နွယ်မှုမရှိကြောင်းနှင့် 1 သည် ကိန်းရှင်များကြားတွင် ခိုင်မာသောဆက်နွယ်မှုကို ညွှန်ပြသော 0 ဖြစ်သည်။

ဥပမာအားဖြင့်၊ မျက်လုံးအရောင်နှင့် လိင်ကွဲပြားမှုကြား ဆက်စပ်မှုရှိမရှိ သိလိုသည်ဆိုကြပါစို့။ ထို့ကြောင့် လူ ၅၀ ကို မေးမြန်းပြီး အောက်ပါရလဒ်များကို ရယူပါသည်။

ဤကိန်းရှင်နှစ်ခုအတွက် Cramer’s V ကိုတွက်ချက်ရန် R တွင်အောက်ပါကုဒ်ကိုသုံးနိုင်သည်။

 library (rcompanion)

#create table
data = matrix(c(6, 9, 8, 5, 12, 10), nrow= 2 )

#view table
data

     [,1] [,2] [,3]
[1,] 6 8 12
[2,] 9 5 10

#calculate Cramer's V
cramerV(data)

Cramer V 
  0.1671

Cramer’s V သည် 0.1671 ဖြစ်သွားသည်။ ဤတန်ဖိုးသည် အလွန်နည်းသောကြောင့် လိင်နှင့် မျက်လုံးအရောင်ကြား ဆက်စပ်မှု အားနည်းနေကြောင်း ညွှန်ပြသည်။

ထပ်လောင်းအရင်းအမြစ်များ

Pearson Correlation Coefficient ကို နိဒါန်း
tetrachoric ဆက်စပ်မှုအကြောင်း နိဒါန်း
အမျိုးအစားအလိုက် သို့မဟုတ် အရေအတွက် ကိန်းရှင်များ- ကွာခြားချက်ကား အဘယ်နည်း။
တိုင်းတာမှုအဆင့်များ- အမည်ခံ၊ ပုံမှန်၊ ကြားကာလနှင့် အချိုး

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်