R တွင် ဆက်စပ်ကိန်းများကို တွက်ချက်ရန် cor() ကိုအသုံးပြုနည်း


variable များကြားရှိ ဆက်စပ်ကိန်းများကို တွက်ချက်ရန် R တွင် cor() function ကိုသုံးနိုင်သည်။

ဤအင်္ဂါရပ်ကိုအသုံးပြုရန် အသုံးအများဆုံးနည်းလမ်းများမှာ အောက်ပါအတိုင်းဖြစ်သည်-

နည်းလမ်း 1- ကိန်းရှင်နှစ်ခုကြားရှိ Pearson ဆက်စပ်ကိန်းကို တွက်ချက်ပါ။

 cor(df$x, df$y)

စဉ်ဆက်မပြတ်ကိန်းရှင်နှစ်ခုကြား ဆက်စပ်မှုကို တွက်ချက်ရာတွင် Pearson ဆက်စပ်ကိန်းကို အသုံးပြုပါ။ (ဥပမာ အရပ်နှင့် ကိုယ်အလေးချိန်)

နည်းလမ်း 2- ဒေတာဘောင်ရှိ ကိန်းဂဏာန်းကိန်းရှင်များအားလုံးကြားရှိ Pearson ဆက်စပ်ကိန်းကို တွက်ချက်ပါ

 cor(df)

ဤနည်းလမ်းသည် ဒေတာဘောင်ရှိ ကိန်းဂဏာန်းကိန်းရှင်များ၏ အတွဲလိုက်ပေါင်းစပ်မှုတစ်ခုစီကြားရှိ Pearson ဆက်စပ်ကိန်းပါသော ဆက်စပ်မက်ထရစ် ကို ပြန်ပေးလိမ့်မည်။

နည်းလမ်း 3- ကိန်းရှင်နှစ်ခုကြားရှိ Spearman ဆက်စပ်ကိန်းကို တွက်ချက်ပါ။

 cor(df$x, df$y, method=' spearman ')

အဆင့်သတ်မှတ်ထားသော ကိန်းရှင်နှစ်ခုကြား ဆက်စပ်မှုကို တွက်ချက်ရာတွင် Spearman ၏ ဆက်စပ်ကိန်းကို အသုံးပြုပါ။ (ဥပမာ- ကျောင်းသားတစ်ဦး၏ သင်္ချာစာမေးပွဲရမှတ်နှင့် အတန်းတစ်တန်းရှိ ၎င်းတို့၏ သိပ္ပံစာမေးပွဲရမှတ် အဆင့်သတ်မှတ်ခြင်း)

နည်းလမ်း 4- ကိန်းရှင်နှစ်ခုကြားရှိ Kendall ဆက်စပ်ကိန်းကို တွက်ချက်ပါ။

 cor(df$x, df$y, method=' kendall ')

Spearman ၏ဆက်စပ်မှုကို သင်အသုံးပြုလိုသောအခါတွင် Kendall ၏ ဆက်စပ်ကိန်းကို အသုံးပြုပါ သို့သော် နမူနာအရွယ်အစားသည် သေးငယ်ပြီး ဆက်စပ်မှုများစွာရှိသည်။

အောက်ဖော်ပြပါနမူနာများသည် စာကျက်ချိန်နာရီအရေအတွက်၊ လေ့ကျင့်ရေးစာမေးပွဲအရေအတွက်နှင့် မတူညီသောကျောင်းသားရှစ်ဦးအတွက် နောက်ဆုံးစာမေးပွဲအဆင့်ကိုပြသသော အောက်ပါဒေတာဘောင်ဖြင့် လက်တွေ့တွင် နည်းလမ်းတစ်ခုစီကို အသုံးပြုနည်းကို ဖော်ပြသည်-

 #create data frame
df <- data. frame (hours=c(1, 1, 3, 2, 4, 3, 5, 6),
                 prac_exams=c(4, 3, 3, 2, 3, 2, 1, 4),
                 score=c(69, 74, 74, 70, 89, 85, 99, 90))

#view data frame
df

  hours prac_exams score
1 1 4 69
2 1 3 74
3 3 3 74
4 2 2 70
5 4 3 89
6 3 2 85
7 5 1 99
8 6 4 90

ဥပမာ 1- ကိန်းရှင်နှစ်ခုကြားရှိ Pearson ဆက်စပ်ကိန်းကို တွက်ချက်ပါ။

နာရီများ နှင့် ရမှတ် variable များကြားရှိ Pearson ဆက်စပ်ကိန်းကို တွက်ချက်ရန် အောက်ပါကုဒ်သည် cor() လုပ်ဆောင်ချက်ကို အသုံးပြုနည်းကို ပြသသည်-

 #calculate Pearson correlation coefficient between hours and score
cor(df$hours, df$score)

[1] 0.8600528

နာရီ နှင့် ရမှတ် ကြားရှိ Pearson ဆက်စပ်ကိန်းကို 0.86 ဖြစ်သည်ကို တွေ့ရှိခဲ့သည်။

သင့်ဒေတာဘောင်တွင် NA တန်ဖိုးများရှိပါက၊ NA တန်ဖိုးများမရှိသော အတန်းများကိုသာ အသုံးပြုရန် use=’complete.obs’ အငြင်းအခုံကို အသုံးပြုနိုင်သည်။

 #calculate Pearson correlation coefficient and ignore any rows with NA
cor(df$hours, df$score, use=' complete.obs ')

ဥပမာ 2- ဂဏန်းကိန်းရှင်အားလုံးကြားရှိ Pearson ဆက်စပ်ကိန်းကို တွက်ချက်ပါ။

အောက်ပါကုဒ်သည် ဒေတာဘောင်ရှိ ကိန်းဂဏာန်းကိန်းရှင်များအားလုံးကြားရှိ Pearson ဆက်စပ်ဆက်စပ်ကိန်းပါဝင်သည့် ဆက်စပ်မက်ထရစ်ကိုဖန်တီးရန် cor() လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-

 #calculate Pearson correlation coefficient between all numeric variables
cor(df)

                hours prac_exams score
hours 1.0000000 -0.1336063 0.8600528
prac_exams -0.1336063 1.0000000 -0.3951028
score 0.8600528 -0.3951028 1.0000000

ဤသည်မှာ ရလဒ်ကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်-

  • နာရီ နှင့် prac_exam များ ကြားရှိ Pearson ဆက်စပ်ကိန်းသည် -0.13 ဖြစ်သည်။
  • နာရီ နှင့် ရမှတ် ကြားရှိ Pearson ဆက်စပ်ကိန်းသည် 0.86 ဖြစ်သည်။
  • prac_exams နှင့် ရမှတ်များ ကြားရှိ Pearson ဆက်စပ်ကိန်းသည် -0.39 ဖြစ်သည်။

မှတ်ချက် – ကိန်းရှင်တစ်ခုချင်းစီကြားရှိ Pearson ဆက်စပ်ကိန်းနှင့် သူ့ဟာသူ အမြဲတမ်း 1 ဖြစ်သောကြောင့် ဆက်စပ်မက်ထရစ်၏ထောင့်ဖြတ်တစ်လျှောက် တန်ဖိုးတစ်ခုစီသည် 1 ဖြစ်သည်။

ဥပမာ 3- ကိန်းရှင်နှစ်ခုကြားရှိ Spearman ဆက်စပ်ကိန်းကို တွက်ချက်ပါ။

နာရီများ နှင့် prac_exam ကိန်းရှင်များကြားရှိ Spearman ဆက်စပ်ကိန်းကို တွက်ချက်ရန် အောက်ပါကုဒ်သည် cor() လုပ်ဆောင်ချက်ကို အသုံးပြုနည်းကို ပြသသည်-

 #calculate Spearman correlation coefficient between hours and prac_exams
cor(df$hours, df$prac_exams, method=' spearman ')

[1] -0.1250391

နာရီ နှင့် prac_exam များ ကြားရှိ Spearman ဆက်စပ်ကိန်းသည် -0.125 ဖြစ်လာသည်။

ဥပမာ 4- ကိန်းရှင်နှစ်ခုကြားရှိ Kendall ဆက်စပ်ကိန်းကို တွက်ချက်ပါ။

နာရီများ နှင့် prac_exam ကိန်းရှင်များအကြား Kendall ဆက်စပ်ကိန်းကို တွက်ချက်ရန် အောက်ပါကုဒ်သည် cor() လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-

 #calculate Kendall's correlation coefficient between hours and prac_exams
cor(df$hours, df$prac_exams, method=' kendall ')

[1] -0.1226791

နာရီ နှင့် prac_exams အကြား Kendall ၏ဆက်စပ်ကိန်းသည် -0.123 ဖြစ်လာသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

R တွင် လျှောတိုက်ဆက်စပ်မှုကို တွက်ချက်နည်း
R တွင် autocorrelation ကိုဘယ်လိုတွက်ရမလဲ
R တွင် တစ်စိတ်တစ်ပိုင်းဆက်စပ်မှုကို တွက်ချက်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်