ပျောက်ဆုံးနေသောတန်ဖိုးများနှင့် r ဆက်စပ်မှုကို တွက်ချက်နည်း


တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကိန်းရှင်တန်ဖိုးများ ပျောက်ဆုံးနေချိန်တွင် R တွင် ဆက်စပ်ကိန်းများကို တွက်ချက်ရန် အောက်ပါနည်းလမ်းများကို သင်အသုံးပြုနိုင်ပါသည်။

Method 1- လက်ရှိပျောက်နေသောတန်ဖိုးများဖြင့် ဆက်စပ်ကိန်းကို တွက်ချက်ပါ။

 cor(x, y, use=' complete.obs ')

နည်းလမ်း 2- ပစ္စုပ္ပန်ပျောက်နေသောတန်ဖိုးများဖြင့် ဆက်စပ်မက်ထရစ်ကို တွက်ချက်ပါ။

 cor(df, use=' pairwise.complete.obs ')

အောက်ဖော်ပြပါ ဥပမာများသည် နည်းလမ်းတစ်ခုစီကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။

ဥပမာ 1- လက်ရှိပျောက်နေသောတန်ဖိုးများဖြင့် ဆက်စပ်ကိန်းကို တွက်ချက်ပါ။

လွဲမှားနေသောတန်ဖိုးများရှိနေချိန်တွင် ကိန်းရှင်နှစ်ခုကြားရှိ Pearson ဆက်စပ်ကိန်းကို တွက်ချက်ရန် cor() လုပ်ဆောင်ချက်ကို ကျွန်ုပ်တို့အသုံးပြုနေသည်ဆိုပါစို့။

 #create two variables
x <- c(70, 78, 90, 87, 84, NA, 91, 74, 83, 85)
y <- c(90, NA, 79, 86, 84, 83, 88, 92, 76, 75)

#attempt to calculate correlation coefficient between x and y
cor(x, y)

[1] NA

ပျောက်ဆုံးနေသောတန်ဖိုးများကိုမည်သို့ကိုင်တွယ်ရမည်ကိုကျွန်ုပ်တို့မသတ်မှတ်ထားသောကြောင့် cor() လုပ်ဆောင်ချက်သည် NA ကို ပြန်ပေးသည်။

ဤပြဿနာကိုရှောင်ရှားရန်၊ ကျွန်ုပ်တို့သည် တန်ဖိုးနှစ်ခုလုံးရှိနေသည့်နေရာတွင် pairwise observations ကို R သိစေရန် use=’complete.obs’ argument ကိုသုံးနိုင်သည်။

 #create two variables
x <- c(70, 78, 90, 87, 84, NA, 91, 74, 83, 85)
y <- c(90, NA, 79, 86, 84, 83, 88, 92, 76, 75)

#calculate correlation coefficient between x and y
cor(x, y, use=' complete.obs ')

[1] -0.4888749

ကိန်းရှင်နှစ်ခုကြားရှိ ဆက်စပ်ကိန်းသည် -0.488749 ဖြစ်သွားသည်။

cor() လုပ်ဆောင်ချက်သည် ဆက်စပ်ကိန်းများကို တွက်ချက်ရာတွင် တန်ဖိုးများ ရှိနေသည့် pairwise ပေါင်းစပ်မှုများကိုသာ အသုံးပြုကြောင်း သတိပြုပါ။

ဥပမာ 2- ပစ္စုပ္ပန်ပျောက်နေသောတန်ဖိုးများဖြင့် ဆက်စပ်မက်ထရစ်ကို တွက်ချက်ပါ။

ဒေတာဘောင်တစ်ခုအတွက် ဆက်စပ်မက်ထရစ် တစ်ခုကို ဖန်တီးရန်အတွက် ကျွန်ုပ်တို့သည် cor() လုပ်ဆောင်ချက်ကို အသုံးပြုရန် ကြိုးစားနေသည်ဆိုပါစို့။

 #create data frame with some missing values
df <- data. frame (x=c(70, 78, 90, 87, 84, NA, 91, 74, 83, 85),
                 y=c(90, NA, 79, 86, 84, 83, 88, 92, 76, 75),
                 z=c(57, 57, 58, 59, 60, 78, 81, 83, NA, 90))

#attempt to create correlation matrix for variables in data frame
cor(df)

   X Y Z
x 1 NA NA
y NA 1 NA
z NA NA 1

ပျောက်နေသောတန်ဖိုးများကို ကိုင်တွယ်နည်းကို ကျွန်ုပ်တို့မသတ်မှတ်ထားသောကြောင့် cor() လုပ်ဆောင်ချက်သည် NA ကို နေရာများစွာတွင် ပြန်ပေးသည်။

ဤပြဿနာကိုရှောင်ရှားရန်၊ ကျွန်ုပ်တို့သည် use=’pairwise.complete.obs’ အငြင်းအခုံကို အသုံးပြုနိုင်ပြီး R သည် တန်ဖိုးနှစ်ခုလုံးရှိနေသည့်နေရာတွင် pairwise observations များကိုသာအသုံးပြုရန်သိနိုင်သည်-

 #create data frame with some missing values
df <- data. frame (x=c(70, 78, 90, 87, 84, NA, 91, 74, 83, 85),
                 y=c(90, NA, 79, 86, 84, 83, 88, 92, 76, 75),
                 z=c(57, 57, 58, 59, 60, 78, 81, 83, NA, 90))

#create correlation matrix for variables using only pairwise complete observations
cor(df, use=' pairwise.complete.obs ')

           X Y Z
x 1.0000000 -0.4888749 0.1311651
y -0.4888749 1.0000000 -0.1562371
z 0.1311651 -0.1562371 1.0000000

ဒေတာဘေ့စ်ရှိ variable များ၏ pairwise ပေါင်းစပ်မှုတစ်ခုစီအတွက် ဆက်စပ်ကိန်းများကို ယခုပြသထားသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

R တွင် ဆက်စပ်ဖော်ကိန်း၏ P တန်ဖိုးကို မည်သို့ရှာမည်နည်း။
R တွင် Spearman ၏ဆက်စပ်မှုကို တွက်နည်း
R တွင် လျှောတိုက်ဆက်စပ်မှုကို တွက်ချက်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်