Categorical variable များကြား ဆက်စပ်မှုကို တွက်ချက်နည်း
စဉ်ဆက်မပြတ် ကိန်းသေကိန်းရှင်များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် Pearson correlation coefficient ကို ကျွန်ုပ်တို့ အသုံးပြုလေ့ရှိသည်။
သို့သော်၊ အမည်များ သို့မဟုတ် အညွှန်းများကဲ့သို့သော အမျိုးအစားခွဲကိန်းရှင်များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် မတူညီသော မက်ထရစ်ကို အသုံးပြုရန် လိုအပ်ပါသည်။
- အိမ်ထောင်ရေးအခြေအနေ (လူပျို၊ အိမ်ထောင်၊ ကွာရှင်း)
- ဆေးလိပ်သောက်ခြင်းအခြေအနေ (ဆေးလိပ်သောက်သူ၊ ဆေးလိပ်မသောက်သူ)
- မျက်လုံးအရောင် (အပြာ၊ အညို၊ အစိမ်း)
categorical variables များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် အသုံးများသော အတိုင်းအတာ သုံးခု ရှိပါသည်။
1. Tetrachoric ဆက်စပ်မှု- binary categorical variables များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် အသုံးပြုသည်။
2. Polychoric ဆက်စပ်မှု- သာမာန် အမျိုးအစားအလိုက် ကိန်းရှင်များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် အသုံးပြုသည်။
3. Cramer’s V- အမည်ခံ အမျိုးအစားအလိုက် ကိန်းရှင်များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် အသုံးပြုသည်။
အောက်ဖော်ပြပါ ကဏ္ဍများသည် ဤတိုင်းတာမှု သုံးခုမှ တစ်ခုစီကို တွက်ချက်နည်း ဥပမာတစ်ခု ပေးပါသည်။
မက်ထရစ် ၁- Tetrachoric ဆက်စပ်မှု
Tetrachoric correlation ကို binary categorical variables များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် အသုံးပြုသည်။ binary variable များသည် ဖြစ်နိုင်သည့်တန်ဖိုးနှစ်ခုမှ တစ်ခုသာယူနိုင်သော variable များဖြစ်ကြောင်း သတိရပါ။
tetrachoric ဆက်စပ်မှုတန်ဖိုးသည် -1 မှ 1 အထိ ကွာဟပြီး -1 သည် ပြင်းထန်သော အနုတ်လက္ခဏာဆက်စပ်မှုကို ညွှန်ပြသည်၊ 0 သည် ဆက်နွယ်မှုမရှိခြင်းကို ညွှန်ပြပြီး 1 သည် ခိုင်မာသောအပြုသဘောဆက်စပ်မှုကို ညွှန်ပြသည်။
ဥပမာအားဖြင့်၊ နိုင်ငံရေး ပါတီတစ်ခုအတွက် ဦးစားပေးမှုတွင် ကျား၊မ ဆက်စပ်မှုရှိ၊ မရှိ သိလိုသည်ဆိုပါစို့။ ဒါကြောင့် မဲဆန္ဒရှင် ၁၀၀ ရဲ့ ရိုးရှင်းတဲ့ ကျပန်းနမူနာကိုယူပြီး နိုင်ငံရေးပါတီတစ်ခုအတွက် သူတို့ရဲ့ လိုလားချက်တွေကို မေးမြန်းပါ။
အောက်ပါဇယားသည် စစ်တမ်း၏ရလဒ်များကို ဖော်ပြသည်။
categorical variable တစ်ခုစီသည် binary ဖြစ်ပြီး၊ ဆိုလိုသည်မှာ၊ variable တစ်ခုစီသည် ဖြစ်နိုင်သော value နှစ်ခုသာ ယူနိုင်သောကြောင့် ဤအခြေအနေတွင် tetrachoric ဆက်စပ်မှုကို ကျွန်ုပ်တို့ အသုံးပြုပါမည်။
variable နှစ်ခုကြားရှိ tetrachoric ဆက်စပ်မှုကို တွက်ချက်ရန် R တွင် အောက်ပါကုဒ်ကို အသုံးပြုနိုင်သည်။
library (psych) #create 2x2 table data = matrix(c(19, 12, 30, 39), nrow= 2 ) #view table data #calculate tetrachoric correlation tetrachoric(data) tetrachoric correlation [1] 0.27
tetrachoric ဆက်စပ်ဆက်နွယ်မှုသည် 0.27 ဖြစ်လာသည်။ ဤတန်ဖိုးသည် အလွန်နိမ့်ကျပြီး ကျား၊မ နှင့် နိုင်ငံရေး ပါတီနှစ်ခြိုက်မှုကြားတွင် အားနည်းခြင်း (ရှိပါက) ပေါင်းသင်းမှုရှိကြောင်း ညွှန်ပြပါသည်။
မက်ထရစ် 2- Polychoric ဆက်စပ်မှု
Polychoric correlation ကို ordinal categorical variables များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် အသုံးပြုသည်။ သာမာန်ကိန်းရှင်များသည် ဖြစ်နိုင်ချေတန်ဖိုးများ သဘာဝအစီအစဥ်ရှိသည့် ကိန်းရှင်များဖြစ်ကြောင်း သတိရပါ။
polychoric ဆက်စပ်မှုတန်ဖိုးသည် -1 မှ 1 မှ ကွာဟပြီး -1 သည် ပြင်းထန်သော အနုတ်လက္ခဏာဆက်စပ်မှုကို ညွှန်ပြသည်၊ 0 သည် ဆက်စပ်မှုမရှိသည်ကို ညွှန်ပြပြီး 1 သည် ခိုင်မာသောအပြုသဘောဆက်စပ်မှုကို ညွှန်ပြသည်။
ဥပမာအားဖြင့်၊ မတူညီသောရုပ်ရှင်အဆင့်သတ်မှတ်ချက်အေဂျင်စီနှစ်ခုသည် ၎င်းတို့၏ရုပ်ရှင်အဆင့်သတ်မှတ်ချက်များကြား မြင့်မားသောဆက်စပ်မှုရှိမရှိကို သင်သိလိုသည်ဆိုကြပါစို့။
အေဂျင်စီတစ်ခုစီအား 1 မှ 3 အတိုင်းအတာဖြင့် မတူညီသောရုပ်ရှင် 20 ကို အဆင့်သတ်မှတ်ရန် 1 က “ ဆိုး” ၊ 2 “ ဆင်းရဲ” နှင့် 3 က “ ကောင်း” ကိုဖော်ပြရန် ကျွန်ုပ်တို့တောင်းဆိုပါသည်။
အောက်ပါဇယားသည် ရလဒ်များကို ပြသသည်-
အေဂျင်စီနှစ်ခု၏ အဆင့်သတ်မှတ်ချက်များကြားတွင် polychoric ဆက်စပ်မှုကို တွက်ချက်ရန် R တွင် အောက်ပါကုဒ်ကို အသုံးပြုနိုင်သည်။
library (polycor) #define movie ratings x <- c(1, 1, 2, 2, 3, 2, 2, 3, 2, 3, 3, 2, 1, 2, 2, 1, 1, 1, 2, 2) y <- c(1, 1, 2, 1, 3, 3, 3, 2, 2, 3, 3, 3, 2, 2, 2, 1, 2, 1, 3, 3) #calculate polychoric correlation between ratings polychor(x, y) [1] 0.7828328
polychoric ဆက်စပ်ဆက်နွယ်မှုသည် 0.78 ဖြစ်လာသည်။ ဤတန်ဖိုးသည် အလွန်မြင့်မားပြီး အေဂျင်စီတစ်ခုစီ၏ အဆင့်သတ်မှတ်ချက်များကြားတွင် အပြုသဘောဆောင်သော ဆက်စပ်မှုရှိကြောင်း ညွှန်ပြပါသည်။
မက်ထရစ် 3- Cramer’s V
Cramer’s V ကို nominal categorical variables များကြား ဆက်စပ်မှုကို တွက်ချက်ရန် အသုံးပြုသည်။ Nominal variable များသည် အမျိုးအစားအညွှန်းများကို ဆောင်ထားသော်လည်း သဘာဝအမှာစာမရှိကြောင်း မှတ်သားထားပါ။
Cramer’s V ၏တန်ဖိုးသည် 0 မှ 1 အထိ ကွာသည်၊ 0 သည် ကိန်းရှင်များကြားတွင် ဆက်နွယ်မှုမရှိကြောင်းနှင့် 1 သည် ကိန်းရှင်များကြားတွင် ခိုင်မာသောဆက်နွယ်မှုကို ညွှန်ပြသော 0 ဖြစ်သည်။
ဥပမာအားဖြင့်၊ မျက်လုံးအရောင်နှင့် လိင်ကွဲပြားမှုကြား ဆက်စပ်မှုရှိမရှိ သိလိုသည်ဆိုကြပါစို့။ ထို့ကြောင့် လူ ၅၀ ကို မေးမြန်းပြီး အောက်ပါရလဒ်များကို ရယူပါသည်။
ဤကိန်းရှင်နှစ်ခုအတွက် Cramer’s V ကိုတွက်ချက်ရန် R တွင်အောက်ပါကုဒ်ကိုသုံးနိုင်သည်။
library (rcompanion) #create table data = matrix(c(6, 9, 8, 5, 12, 10), nrow= 2 ) #view table data [,1] [,2] [,3] [1,] 6 8 12 [2,] 9 5 10 #calculate Cramer's V cramerV(data) Cramer V 0.1671
Cramer’s V သည် 0.1671 ဖြစ်သွားသည်။ ဤတန်ဖိုးသည် အလွန်နည်းသောကြောင့် လိင်နှင့် မျက်လုံးအရောင်ကြား ဆက်စပ်မှု အားနည်းနေကြောင်း ညွှန်ပြသည်။
ထပ်လောင်းအရင်းအမြစ်များ
Pearson Correlation Coefficient ကို နိဒါန်း
tetrachoric ဆက်စပ်မှုအကြောင်း နိဒါန်း
အမျိုးအစားအလိုက် သို့မဟုတ် အရေအတွက် ကိန်းရှင်များ- ကွာခြားချက်ကား အဘယ်နည်း။
တိုင်းတာမှုအဆင့်များ- အမည်ခံ၊ ပုံမှန်၊ ကြားကာလနှင့် အချိုး