วิธีการพล็อตการกระจายค่าคอลัมน์ใน r
คุณสามารถใช้วิธีการต่อไปนี้เพื่อพล็อตการกระจายค่าคอลัมน์ใน R:
วิธีที่ 1: พล็อตการกระจายค่าโดยใช้กราฟความหนาแน่น
plot(density(df$my_column))
วิธีที่ 2: พล็อตการกระจายค่าโดยใช้ฮิสโตแกรม
hist(df$my_column)
ตัวอย่างต่อไปนี้แสดงวิธีการใช้แต่ละวิธีในทางปฏิบัติกับกรอบข้อมูลต่อไปนี้
#create data frame df = data. frame (team=rep(c(' A ', ' B '), each= 10 ), points=c(3, 3, 4, 5, 4, 7, 7, 7, 10, 11, 8, 7, 8, 9, 12, 12, 12, 14, 15, 17)) #view data frame df team points 1 to 3 2 to 3 3 to 4 4 to 5 5 to 4 6 to 7 7 to 7 8 to 7 9 to 10 10 to 11 11 B 8 12 B 7 13 B 8 14 B 9 15 B 12 16 B 12 17 B 12 18 B 14 19 B 15 20 B 17
ตัวอย่างที่ 1: พล็อตการกระจายค่าโดยใช้กราฟความหนาแน่น
รหัสต่อไปนี้แสดงวิธีการพล็อตการกระจายค่าในคอลัมน์ จุด โดยใช้ กราฟความหนาแน่น :
#plot distribution of values in points column
plot(density(df$points))
ไวยากรณ์นี้สร้างเส้นโค้งเรียบที่สรุปการกระจายค่าของตัวแปร
โปรดทราบว่าเราสามารถเปลี่ยนชื่อเรื่อง ป้ายกำกับแกน และสีของเส้นในแผนภูมิความหนาแน่นได้ หากเราต้องการ:
#plot distribution of values in points column plot(density(df$points), col=' red ', main=' Density Plot of Points ', xlab=' Points ')
ตัวอย่างที่ 2: พล็อตการกระจายของค่าโดยใช้ฮิสโตแกรม
รหัสต่อไปนี้แสดงวิธีการพล็อตการกระจายค่าในคอลัมน์ จุด โดยใช้ฮิสโตแกรม:
#plot distribution of values in points column using histogram
hist(df$points)
ฮิสโตแกรมใช้แท่งเพื่อแสดงความถี่ของค่าในคอลัมน์ จุด ตรงข้ามกับเส้นเรียบที่สรุปรูปร่างของการแจกแจง.
โปรดทราบว่าเราสามารถเปลี่ยนชื่อเรื่อง ป้ายแกน สี และจำนวนการข้ามที่ใช้ในฮิสโตแกรมได้:
#plot distribution of values in points column using histogram hist(df$points, main=' Histogram of Points ', xlab=' Points ', col=' steelblue ', breaks= 12 )
หมายเหตุ : ยิ่งคุณเลือกค่าสำหรับอาร์กิวเมนต์ ตัวแบ่ง มากเท่าใด ฮิสโตแกรมก็จะยิ่งมีแถบมากขึ้นเท่านั้น
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน R:
วิธีเพิ่มเส้นแนวตั้งให้กับฮิสโตแกรมใน R
วิธีสร้างแปลงความหนาแน่นของเคอร์เนลใน R
วิธีการซ้อนทับแปลงความหนาแน่นใน ggplot2