วิธีการคำนวณค่าเบี่ยงเบนมาตรฐานของคอลัมน์ใน r


คุณสามารถใช้ไวยากรณ์พื้นฐานต่อไปนี้เพื่อคำนวณค่าเบี่ยงเบนมาตรฐานของคอลัมน์ใน R:

 #calculate standard deviation of one column
sd(df$col1)

#calculate standard deviation of all columns
sapply(df, sd)

#calculate standard deviation of specific columns
sapply(df[c(' col1 ', ' col2 ', ' col5 ')], sd)

ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติกับกรอบข้อมูลต่อไปนี้:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                 points=c(99, 91, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28))

#view data frame
df

  team points assists rebounds
1 A 99 33 30
2 B 91 28 28
3 C 86 31 24
4 D 88 39 24
5 E 95 34 28

ตัวอย่างที่ 1: ส่วนเบี่ยงเบนมาตรฐานของคอลัมน์

รหัสต่อไปนี้แสดงวิธีการคำนวณค่าเบี่ยงเบนมาตรฐานของคอลัมน์ในกรอบข้อมูล:

 #calculate standard deviation of 'points' column
sd(df$points)

[1] 5.263079

ค่าเบี่ยงเบนมาตรฐานของค่าในคอลัมน์ “คะแนน” คือ 5.263079 .

ตัวอย่างที่ 2: ส่วนเบี่ยงเบนมาตรฐานของทุกคอลัมน์

รหัสต่อไปนี้แสดงวิธีการคำนวณค่าเบี่ยงเบนมาตรฐานของแต่ละคอลัมน์ในกรอบข้อมูล:

 #calculate standard deviation of all columns in data frame
sapply(df, sd)

    team points assists rebounds 
      NA 5.263079 4.062019 2.683282 
Warning message:
In var(if (is.vector(x) || is.factor(x)) x else as.double(x), na.rm = na.rm):
  NAs introduced by coercion

เนื่องจากคอลัมน์ “ทีม” เป็นตัวแปรอักขระ R จึงส่งคืน NA และแจ้งเตือนเรา

อย่างไรก็ตาม สามารถคำนวณค่าเบี่ยงเบนมาตรฐานของคอลัมน์ตัวเลขอีกสามคอลัมน์ได้สำเร็จ

ตัวอย่างที่ 3: ค่าเบี่ยงเบนมาตรฐานของคอลัมน์เฉพาะ

รหัสต่อไปนี้แสดงวิธีการคำนวณค่าเบี่ยงเบนมาตรฐานของคอลัมน์เฉพาะในกรอบข้อมูล:

 #calculate standard deviation of 'points' and 'rebounds' columns
sapply(df[c(' points ', ' rebounds ')], sd)

  rebound points 
5.263079 2.683282

โปรดทราบว่าเราสามารถใช้ค่าดัชนีคอลัมน์เพื่อเลือกคอลัมน์ได้:

 #calculate standard deviation of 'points' and 'rebounds' columns
sapply(df[c(2, 4)], sd)

  rebound points 
5.263079 2.683282

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีการใช้งานฟังก์ชันทั่วไปอื่นๆ ใน R:

วิธีการคำนวณค่าเบี่ยงเบนมาตรฐานของแถวใน R
วิธีการคำนวณค่าเฉลี่ยของหลายคอลัมน์ใน R
วิธีค้นหาค่าสูงสุดในหลายคอลัมน์ใน R
วิธีเลือกคอลัมน์เฉพาะใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *