R တွင် အကျဉ်းချုပ်ဇယားများ ဖန်တီးရန် အလွယ်ဆုံးနည်းလမ်း


R တွင် အကျဉ်းချုပ်ဇယားများဖန်တီးရန် အလွယ်ဆုံးနည်းလမ်းမှာ စိတ်ပညာ စာကြည့်တိုက်မှ describe() နှင့် describeBy() လုပ်ဆောင်ချက်များကို အသုံးပြုရန်ဖြစ်သည်။

 library (psych)

#create summary table
describe(df)

#create summary table, grouped by a specific variable
describeBy(df, group=df$var_name)

အောက်ဖော်ပြပါ ဥပမာများသည် ဤလုပ်ဆောင်ချက်များကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။

ဥပမာ 1- အခြေခံ အနှစ်ချုပ်ဇယားကို ဖန်တီးပါ။

R တွင် အောက်ပါ data frame ရှိသည်ဆိုပါစို့။

 #create data frame
df <- data. frame (team=c('A', 'A', 'B', 'B', 'C', 'C', 'C'),
                 points=c(15, 22, 29, 41, 30, 11, 19),
                 rebounds=c(7, 8, 6, 6, 7, 9, 13),
                 steals=c(1, 1, 2, 3, 5, 7, 5))

#view data frame
df

  team points rebounds steals
1 to 15 7 1
2 A 22 8 1
3 B 29 6 2
4 B 41 6 3
5 C 30 7 5
6 C 11 9 7
7 C 19 13 5

ဒေတာဘောင်ရှိ ကိန်းရှင်တစ်ခုစီအတွက် အကျဉ်းချုပ်ဇယားတစ်ခုဖန်တီးရန် describe() လုပ်ဆောင်ချက်ကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-

 library (psych)

#create summary table
describe(df)

         vars n mean sd median trimmed mad min max range skew kurtosis
team* 1 7 2.14 0.90 2 2.14 1.48 1 3 2 -0.22 -1.90
points 2 7 23.86 10.24 22 23.86 10.38 11 41 30 0.33 -1.41
rebounds 3 7 8.00 2.45 7 8.00 1.48 6 13 7 1.05 -0.38
steals 4 7 3.43 2.30 3 3.43 2.97 1 7 6 0.25 -1.73
           se
team* 0.34
points 3.87
rebounds 0.93
steals 0.87

ဤသည်မှာ ရလဒ်တစ်ခုစီ၏ တန်ဖိုးတစ်ခုစီကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုရမည်နည်း။

  • vars : ကော်လံ နံပါတ်
  • n : တရားဝင်သော အမှုအရေအတွက်
  • ပျမ်းမျှ : ပျမ်းမျှတန်ဖိုး
  • median : ပျမ်းမျှတန်ဖိုး
  • ဖြတ်တောက်ခြင်း – ဖြတ်တောက်ထားသော ဆိုလိုရင်း (မူရင်းအားဖြင့်၊ အဆုံးတစ်ခုစီတွင် လေ့လာတွေ့ရှိမှုများ၏ 10% ကို ဖယ်ရှားသည်)
  • mad : အကြွင်းမဲ့ မီဒီယံ သွေဖည်မှု (အလယ်အလတ်မှ)
  • min : အနိမ့်ဆုံးတန်ဖိုး
  • max : အမြင့်ဆုံးတန်ဖိုး
  • အပိုင်းအခြား – တန်ဖိုးများ၏ အကွာအဝေး (အမြင့်ဆုံး – မိနစ်)
  • skew : မညီမညွတ်
  • kurtosis : ပြားချပ်ချပ်
  • se : စံအမှား

ကြယ်ပွင့် (*) ပါသော မည်သည့် variable မဆို အမျိုးအစားအလိုက် သို့မဟုတ် ယုတ္တိဗေဒကိန်းရှင်တစ်ခုဖြစ်ပြီး တန်ဖိုးများ၏ ဂဏန်းအစီအစဥ်ကို ကိုယ်စားပြုသည့် တန်ဖိုးများဖြင့် ကိန်းဂဏာန်းကိန်းရှင်အဖြစ်သို့ ပြောင်းလဲထားသည်ကို သတိပြုရန် အရေးကြီးပါသည်။

ကျွန်ုပ်တို့၏ဥပမာတွင်၊ “ အဖွဲ့” ကိန်းရှင်သည် ကိန်းဂဏာန်းကိန်းရှင်အဖြစ်သို့ ပြောင်းလဲသွားသောကြောင့် သက်ဆိုင်ရာ အကျဉ်းချုပ်စာရင်းဇယားကို စာသားအတိုင်း အဓိပ္ပါယ်မဖော်သင့်ပါ။

အသုံးအများဆုံး အနှစ်ချုပ်စာရင်းဇယားများကိုသာ တွက်ချက်ရန် fast=TRUE အကြောင်းပြချက်ကို သင်သုံးနိုင်သည်ကိုလည်း သတိပြုပါ။

 #create smaller summary table
describe(df, fast= TRUE )

         vars n mean sd min max range se
team 1 7 NaN NA Inf -Inf -Inf NA
points 2 7 23.86 10.24 11 41 30 3.87
rebounds 3 7 8.00 2.45 6 13 7 0.93
steals 4 7 3.43 2.30 1 7 6 0.87

ဒေတာဘောင်ရှိ အချို့သောကိန်းရှင်များအတွက် အကျဉ်းချုပ်စာရင်းအင်းများကိုသာ တွက်ချက်ရန်လည်း ရွေးချယ်နိုင်သည်-

 #create summary table for just 'points' and 'rebounds' columns
describe(df[, c(' points ', ' rebounds ')], fast= TRUE )

         vars n mean sd min max range se
points 1 7 23.86 10.24 11 41 30 3.87
rebounds 2 7 8.00 2.45 6 13 7 0.93

ဥပမာ 2- သတ်မှတ်ထားသော ကိန်းရှင်ဖြင့် အုပ်စုဖွဲ့ပြီး အကျဉ်းချုပ်ဇယားကို ဖန်တီးပါ။

“ team” variable ဖြင့် အုပ်စုဖွဲ့ထားသော ဒေတာဘောင်အတွက် အကျဉ်းချုပ်ဇယားတစ်ခုဖန်တီးရန် အောက်ပါကုဒ်သည် describeBy() လုပ်ဆောင်ချက်ကို အသုံးပြုနည်းကို ပြသသည်-

 #create summary table, grouped by 'team' variable
describeBy(df, group=df$team, fast= TRUE )

 Descriptive statistics by group 
group: A
         vars n mean sd min max range se
team 1 2 NaN NA Inf -Inf -Inf NA
points 2 2 18.5 4.95 15 22 7 3.5
rebounds 3 2 7.5 0.71 7 8 1 0.5
steals 4 2 1.0 0.00 1 1 0 0.0
-------------------------------------------------- ---------- 
group: B
         vars n mean sd min max range se
team 1 2 NaN NA Inf -Inf -Inf NA
points 2 2 35.0 8.49 29 41 12 6.0
rebounds 3 2 6.0 0.00 6 6 0 0.0
steals 4 2 2.5 0.71 2 3 1 0.5
-------------------------------------------------- ---------- 
group: C
         vars n mean sd min max range se
team 1 3 NaN NA Inf -Inf -Inf NA
points 2 3 20.00 9.54 11 30 19 5.51
rebounds 3 3 9.67 3.06 7 13 6 1.76
steals 4 3 5.67 1.15 5 7 2 0.67

ရလဒ်သည် ဒေတာဘောင်ရှိ အသင်းသုံးသင်းမှ တစ်ခုစီအတွက် အကျဉ်းချုပ်စာရင်းဇယားကို ပြသသည်။

ထပ်လောင်းအရင်းအမြစ်များ

R တွင် ဂဏန်းငါးလုံး၏ အကျဉ်းချုပ်ကို တွက်နည်း
R တွင် အုပ်စုအလိုက် ပျမ်းမျှတွက်နည်း
R တွင် အုပ်စုအလိုက် ပေါင်းစည်းနည်း
R တွင် ကွဲလွဲမှုကို တွက်ချက်နည်း
R တွင် ကွဲပြားသော မက်ထရစ်ကို ဖန်တီးနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်