R ဖြင့် mahalanobis အကွာအဝေးကို တွက်နည်း


Mahalanobis အကွာအဝေး သည် အမျိုးမျိုးကွဲပြားသောနေရာတစ်ခုရှိ အမှတ်နှစ်ခုကြားအကွာအဝေးဖြစ်သည်။

ကိန်းရှင်များစွာပါ၀င်သော စာရင်းအင်းခွဲခြမ်းစိတ်ဖြာမှုတွင် အစွန်းထွက်များကို ရှာဖွေရန် ၎င်းကို မကြာခဏအသုံးပြုသည်။

ဤသင်ခန်းစာတွင် Mahalanobis အကွာအဝေးကို R ဖြင့် တွက်ချက်နည်းကို ရှင်းပြထားသည်။

ဥပမာ- R တွင် Mahalanobis အကွာအဝေး

R ရှိ ဒေတာအတွဲတစ်ခုရှိ စောင့်ကြည့်မှု တစ်ခုစီအတွက် Mahalanobis အကွာအဝေးကို တွက်ချက်ရန် အောက်ပါအဆင့်များကို အသုံးပြုပါ။

အဆင့် 1: ဒေတာအတွဲကို ဖန်တီးပါ။

ပထမဦးစွာ၊ ကျောင်းသား 20 ၏ စာမေးပွဲရမှတ်များကို ဖော်ပြမည့် ဒေတာအတွဲတစ်ခု ဖန်တီးပြီး ၎င်းတို့သည် ၎င်းတို့လေ့လာခဲ့သည့် နာရီအရေအတွက်၊ ၎င်းတို့ဖြေဆိုခဲ့သည့် လက်တွေ့စာမေးပွဲအရေအတွက်နှင့် သင်တန်းတွင် ၎င်းတို့၏ လက်ရှိအတန်းများကို ဖော်ပြသည်-

 #create data
df = data.frame(score = c(91, 93, 72, 87, 86, 73, 68, 87, 78, 99, 95, 76, 84, 96, 76, 80, 83, 84, 73, 74) ,
        hours = c(16, 6, 3, 1, 2, 3, 2, 5, 2, 5, 2, 3, 4, 3, 3, 3, 4, 3, 4, 4),
        prep = c(3, 4, 0, 3, 4, 0, 1, 2, 1, 2, 3, 3, 3, 2, 2, 2, 3, 3, 2, 2),
        grade = c(70, 88, 80, 83, 88, 84, 78, 94, 90, 93, 89, 82, 95, 94, 81, 93, 93, 90, 89, 89))

#view first six rows of data
head(df)

  score hours prep grade
1 91 16 3 70
2 93 6 4 88
3 72 3 0 80
4 87 1 3 83
5 86 2 4 88
6 73 3 0 84

အဆင့် 2- စူးစမ်းမှုတစ်ခုစီအတွက် Mahalanobis အကွာအဝေးကို တွက်ချက်ပါ။

ထို့နောက်၊ အောက်ဖော်ပြပါ syntax ကိုအသုံးပြုသည့် ရှုထောင့်တစ်ခုစီအတွက် Mahalanobis အကွာအဝေးကို တွက်ချက်ရန် R တွင် တည်ဆောက်ထားသော mahalanobis() လုပ်ဆောင်ချက်ကို အသုံးပြုပါမည်။

mahalanobis (x၊ ဗဟို၊ cov)

ရွှေ-

  • x: ဒေတာမက်ထရစ်
  • အလယ်- ဖြန့်ဖြူးမှု၏ ပျမ်းမျှ vector
  • cov

အောက်ပါကုဒ်သည် ကျွန်ုပ်တို့၏ဒေတာအတွဲအတွက် ဤလုပ်ဆောင်ချက်ကို မည်သို့အကောင်အထည်ဖော်ရမည်ကို ပြသသည်-

 #calculate Mahalanobis distance for each observation
mahalanobis(df, colMeans(df), cov(df))

 [1] 16.5019630 2.6392864 4.8507973 5.2012612 3.8287341 4.0905633
 [7] 4.2836303 2.4198736 1.6519576 5.6578253 3.9658770 2.9350178
[13] 2.8102109 4.3682945 1.5610165 1.4595069 2.0245748 0.7502536
[19] 2.7351292 2.2642268

အဆင့် 3- Mahalanobis အကွာအဝေးတစ်ခုစီအတွက် p-တန်ဖိုးကို တွက်ချက်ပါ။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်