R တွင် ဆက်စပ်ကိန်းများကို တွက်ချက်ရန် cor() ကိုအသုံးပြုနည်း
variable များကြားရှိ ဆက်စပ်ကိန်းများကို တွက်ချက်ရန် R တွင် cor() function ကိုသုံးနိုင်သည်။
ဤအင်္ဂါရပ်ကိုအသုံးပြုရန် အသုံးအများဆုံးနည်းလမ်းများမှာ အောက်ပါအတိုင်းဖြစ်သည်-
နည်းလမ်း 1- ကိန်းရှင်နှစ်ခုကြားရှိ Pearson ဆက်စပ်ကိန်းကို တွက်ချက်ပါ။
cor(df$x, df$y)
စဉ်ဆက်မပြတ်ကိန်းရှင်နှစ်ခုကြား ဆက်စပ်မှုကို တွက်ချက်ရာတွင် Pearson ဆက်စပ်ကိန်းကို အသုံးပြုပါ။ (ဥပမာ အရပ်နှင့် ကိုယ်အလေးချိန်)
နည်းလမ်း 2- ဒေတာဘောင်ရှိ ကိန်းဂဏာန်းကိန်းရှင်များအားလုံးကြားရှိ Pearson ဆက်စပ်ကိန်းကို တွက်ချက်ပါ
cor(df)
ဤနည်းလမ်းသည် ဒေတာဘောင်ရှိ ကိန်းဂဏာန်းကိန်းရှင်များ၏ အတွဲလိုက်ပေါင်းစပ်မှုတစ်ခုစီကြားရှိ Pearson ဆက်စပ်ကိန်းပါသော ဆက်စပ်မက်ထရစ် ကို ပြန်ပေးလိမ့်မည်။
နည်းလမ်း 3- ကိန်းရှင်နှစ်ခုကြားရှိ Spearman ဆက်စပ်ကိန်းကို တွက်ချက်ပါ။
cor(df$x, df$y, method=' spearman ')
အဆင့်သတ်မှတ်ထားသော ကိန်းရှင်နှစ်ခုကြား ဆက်စပ်မှုကို တွက်ချက်ရာတွင် Spearman ၏ ဆက်စပ်ကိန်းကို အသုံးပြုပါ။ (ဥပမာ- ကျောင်းသားတစ်ဦး၏ သင်္ချာစာမေးပွဲရမှတ်နှင့် အတန်းတစ်တန်းရှိ ၎င်းတို့၏ သိပ္ပံစာမေးပွဲရမှတ် အဆင့်သတ်မှတ်ခြင်း)
နည်းလမ်း 4- ကိန်းရှင်နှစ်ခုကြားရှိ Kendall ဆက်စပ်ကိန်းကို တွက်ချက်ပါ။
cor(df$x, df$y, method=' kendall ')
Spearman ၏ဆက်စပ်မှုကို သင်အသုံးပြုလိုသောအခါတွင် Kendall ၏ ဆက်စပ်ကိန်းကို အသုံးပြုပါ သို့သော် နမူနာအရွယ်အစားသည် သေးငယ်ပြီး ဆက်စပ်မှုများစွာရှိသည်။
အောက်ဖော်ပြပါနမူနာများသည် စာကျက်ချိန်နာရီအရေအတွက်၊ လေ့ကျင့်ရေးစာမေးပွဲအရေအတွက်နှင့် မတူညီသောကျောင်းသားရှစ်ဦးအတွက် နောက်ဆုံးစာမေးပွဲအဆင့်ကိုပြသသော အောက်ပါဒေတာဘောင်ဖြင့် လက်တွေ့တွင် နည်းလမ်းတစ်ခုစီကို အသုံးပြုနည်းကို ဖော်ပြသည်-
#create data frame
df <- data. frame (hours=c(1, 1, 3, 2, 4, 3, 5, 6),
prac_exams=c(4, 3, 3, 2, 3, 2, 1, 4),
score=c(69, 74, 74, 70, 89, 85, 99, 90))
#view data frame
df
hours prac_exams score
1 1 4 69
2 1 3 74
3 3 3 74
4 2 2 70
5 4 3 89
6 3 2 85
7 5 1 99
8 6 4 90
ဥပမာ 1- ကိန်းရှင်နှစ်ခုကြားရှိ Pearson ဆက်စပ်ကိန်းကို တွက်ချက်ပါ။
နာရီများ နှင့် ရမှတ် variable များကြားရှိ Pearson ဆက်စပ်ကိန်းကို တွက်ချက်ရန် အောက်ပါကုဒ်သည် cor() လုပ်ဆောင်ချက်ကို အသုံးပြုနည်းကို ပြသသည်-
#calculate Pearson correlation coefficient between hours and score
cor(df$hours, df$score)
[1] 0.8600528
နာရီ နှင့် ရမှတ် ကြားရှိ Pearson ဆက်စပ်ကိန်းကို 0.86 ဖြစ်သည်ကို တွေ့ရှိခဲ့သည်။
သင့်ဒေတာဘောင်တွင် NA တန်ဖိုးများရှိပါက၊ NA တန်ဖိုးများမရှိသော အတန်းများကိုသာ အသုံးပြုရန် use=’complete.obs’ အငြင်းအခုံကို အသုံးပြုနိုင်သည်။
#calculate Pearson correlation coefficient and ignore any rows with NA cor(df$hours, df$score, use=' complete.obs ')
ဥပမာ 2- ဂဏန်းကိန်းရှင်အားလုံးကြားရှိ Pearson ဆက်စပ်ကိန်းကို တွက်ချက်ပါ။
အောက်ပါကုဒ်သည် ဒေတာဘောင်ရှိ ကိန်းဂဏာန်းကိန်းရှင်များအားလုံးကြားရှိ Pearson ဆက်စပ်ဆက်စပ်ကိန်းပါဝင်သည့် ဆက်စပ်မက်ထရစ်ကိုဖန်တီးရန် cor() လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-
#calculate Pearson correlation coefficient between all numeric variables
cor(df)
hours prac_exams score
hours 1.0000000 -0.1336063 0.8600528
prac_exams -0.1336063 1.0000000 -0.3951028
score 0.8600528 -0.3951028 1.0000000
ဤသည်မှာ ရလဒ်ကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်-
- နာရီ နှင့် prac_exam များ ကြားရှိ Pearson ဆက်စပ်ကိန်းသည် -0.13 ဖြစ်သည်။
- နာရီ နှင့် ရမှတ် ကြားရှိ Pearson ဆက်စပ်ကိန်းသည် 0.86 ဖြစ်သည်။
- prac_exams နှင့် ရမှတ်များ ကြားရှိ Pearson ဆက်စပ်ကိန်းသည် -0.39 ဖြစ်သည်။
မှတ်ချက် – ကိန်းရှင်တစ်ခုချင်းစီကြားရှိ Pearson ဆက်စပ်ကိန်းနှင့် သူ့ဟာသူ အမြဲတမ်း 1 ဖြစ်သောကြောင့် ဆက်စပ်မက်ထရစ်၏ထောင့်ဖြတ်တစ်လျှောက် တန်ဖိုးတစ်ခုစီသည် 1 ဖြစ်သည်။
ဥပမာ 3- ကိန်းရှင်နှစ်ခုကြားရှိ Spearman ဆက်စပ်ကိန်းကို တွက်ချက်ပါ။
နာရီများ နှင့် prac_exam ကိန်းရှင်များကြားရှိ Spearman ဆက်စပ်ကိန်းကို တွက်ချက်ရန် အောက်ပါကုဒ်သည် cor() လုပ်ဆောင်ချက်ကို အသုံးပြုနည်းကို ပြသသည်-
#calculate Spearman correlation coefficient between hours and prac_exams cor(df$hours, df$prac_exams, method=' spearman ') [1] -0.1250391
နာရီ နှင့် prac_exam များ ကြားရှိ Spearman ဆက်စပ်ကိန်းသည် -0.125 ဖြစ်လာသည်။
ဥပမာ 4- ကိန်းရှင်နှစ်ခုကြားရှိ Kendall ဆက်စပ်ကိန်းကို တွက်ချက်ပါ။
နာရီများ နှင့် prac_exam ကိန်းရှင်များအကြား Kendall ဆက်စပ်ကိန်းကို တွက်ချက်ရန် အောက်ပါကုဒ်သည် cor() လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-
#calculate Kendall's correlation coefficient between hours and prac_exams cor(df$hours, df$prac_exams, method=' kendall ') [1] -0.1226791
နာရီ နှင့် prac_exams အကြား Kendall ၏ဆက်စပ်ကိန်းသည် -0.123 ဖြစ်လာသည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
R တွင် လျှောတိုက်ဆက်စပ်မှုကို တွက်ချက်နည်း
R တွင် autocorrelation ကိုဘယ်လိုတွက်ရမလဲ
R တွင် တစ်စိတ်တစ်ပိုင်းဆက်စပ်မှုကို တွက်ချက်နည်း