R တွင် အတွဲကွက်များကို ဖန်တီးနည်း
pair plot သည် data set တစ်ခုရှိ မတူညီသော variable များကြားတွင် pairwise ဆက်စပ်မှုကို နားလည်နိုင်စေမည့် scatterplot matrix တစ်ခုဖြစ်သည်။
ကံကောင်းစွာဖြင့်၊ pairs() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ R တွင် အတွဲကွက်တစ်ခုကို ဖန်တီးရန် လွယ်ကူသည်။ ဤသင်ခန်းစာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးပြုခြင်း၏ ဥပမာများစွာကို ပေးပါသည်။
ဥပမာ 1- ကိန်းရှင်အားလုံး၏ တွဲကွက်
အောက်ပါကုဒ်သည် R ရှိ ဒေတာဘောင်ရှိ ကိန်းရှင်အားလုံးအတွက် အခြေခံအတွဲတွဲကွက်တစ်ခုကို ဖန်တီးနည်းကို သရုပ်ပြသည်-
#make this example reproducible set.seed(0) #create data frame var1 <- rnorm(1000) var2 <- var1 + rnorm(1000, 0, 2) var3 <- var2 - rnorm(1000, 0, 5) df <- data.frame(var1, var2, var3) #create pairs plot peers(df)
မက်ထရစ်ကို အဓိပ္ပာယ်ဖွင့်ဆိုရန် နည်းလမ်းမှာ အောက်ပါအတိုင်းဖြစ်သည်။
- ပြောင်းလဲနိုင်သောအမည်များကို ထောင့်ဖြတ်အကွက်များတစ်လျှောက် ပြသထားသည်။
- အခြားအကွက်များအားလုံးသည် ကိန်းရှင်များ အတွဲလိုက် ပေါင်းစပ်မှုတစ်ခုကြားရှိ ဆက်နွယ်မှု၏ အကွက်အကွင်းကို ပြသသည်။ ဥပမာအားဖြင့်၊ matrix ၏အပေါ်ဘက်ညာဘက်ထောင့်ရှိ ဧရိယာသည် var1 နှင့် var3 အတွက် တန်ဖိုးများကို ဖြန့်ကျက်ပြသထားသည်။ အလယ်ဘယ်ဘက်အကွက်တွင် var1 နှင့် var2 နှင့် အခြားအရာများအတွက် တန်ဖိုးများကို ဖြန့်ကျက်ပြသထားသည်။
ဤဂရပ်တစ်ခုတည်းသည် ကျွန်ုပ်တို့၏ဒေတာအစုံရှိ ကိန်းရှင်အတွဲတစ်ခုစီကြားရှိ ဆက်စပ်မှုကို အကြံဉာဏ်ပေးသည်။ ဥပမာအားဖြင့်၊ var1 နှင့် var2 တို့သည် var1 နှင့် var3 အနည်းငယ်မျှ သို့မဟုတ် ဆက်စပ်မှုမရှိပုံပေါ်သော်လည်း အပြုသဘောဆက်စပ်နေပုံရသည်။
ဥပမာ 2- သတ်မှတ်ထားသော Variables အတွဲများကို ရေးဆွဲခြင်း။
အောက်ပါကုဒ်သည် ဒေတာအတွဲတစ်ခုရှိ ပထမကိန်းရှင်နှစ်ခုသာအတွက် အခြေခံတွဲကွက်တစ်ခုကို ဖန်တီးနည်းကို သရုပ်ပြသည်-
#create pairs plot for var1 and var2 only
even(df[, 1:2])
ဥပမာ 3- အတွဲကွက်တစ်ခု၏ အလှတရားကို ပြောင်းလဲပါ။
အောက်ဖော်ပြပါ ကုဒ်သည် ခေါင်းစဉ်၊ အရောင်နှင့် အညွှန်းများအပါအဝင် အတွဲကွက်တစ်ခု၏ အလှတရားကို မည်သို့ပြောင်းလဲရမည်ကို သရုပ်ပြသည်-
peers(df, col = ' blue ', #modify color labels = c(' First ', ' Second ', ' Third '), #modify labels main = ' Custom Title ') #modify title
ဥပမာ 4- ggpairs နှင့် ဆက်စပ်မှုများကို ရယူခြင်း။
GGally စာကြည့်တိုက်မှ ggpairs() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ ကိန်းရှင်များကြားရှိ Pearson ဆက်စပ်ကိန်းကို သင်ရနိုင်သည်။ အောက်ပါကုဒ်သည် ဤလုပ်ဆောင်ချက်ကိုအသုံးပြုပုံကို သရုပ်ပြသည်-
#install necessary libraries install.packages('ggplot2') install.packages('GGally') #load libraries library(ggplot2) library(GGally) #create pairs plot ggpairs(df)
ဤမက်ထရစ်ကို အဓိပ္ပာယ်ဖွင့်ဆိုရန် နည်းလမ်းမှာ အောက်ပါအတိုင်းဖြစ်သည်။
- ပြောင်းလဲနိုင်သောအမည်များကို matrix ၏ အပြင်ဘက်အစွန်းများတွင် ပြသထားသည်။
- ထောင့်ဖြတ်များတစ်လျှောက် သေတ္တာများသည် ကိန်းရှင်တစ်ခုစီအတွက် သိပ်သည်းဆကွက်ကွက်ကို ပြသသည်။
- ဘယ်ဘက်အောက်ထောင့်ရှိ အကွက်များသည် variable တစ်ခုစီကြားတွင် ဖြန့်ကျက်ပြသထားသည်။
- ညာဘက်အပေါ်ထောင့်ရှိ အကွက်များသည် ကိန်းရှင်တစ်ခုစီကြားရှိ Pearson ဆက်စပ်ကိန်းကို ပြသသည်။ ဥပမာ၊ var1 နှင့် var2 အကြားဆက်စပ်မှုသည် 0.425 ဖြစ်သည်။
အခြေခံ R pairs() function ထက် ggpairs() ကို အသုံးပြုခြင်း၏အားသာချက်မှာ variables များအကြောင်းပိုမိုသိရှိနိုင်ခြင်းကြောင့်ဖြစ်သည်။ အတိအကျအားဖြင့်၊ variable တစ်ခုစီ၏ pairwise ပေါင်းစပ်မှုတစ်ခုနှင့်တစ်ခုကြားရှိ ဆက်စပ်ကိန်းကို သင်တွေ့မြင်နိုင်သည်၊ ကိန်းရှင်တစ်ခုစီအတွက် သိပ်သည်းဆကွက်ကွက်ကို သင်မြင်နိုင်သည်။
ggpairs() လုပ်ဆောင်ချက်အတွက် စာရွက်စာတမ်းအပြည့်အစုံကို ဤနေရာတွင် ရှာဖွေနိုင်ပါသည်။