วิธีสร้าง boxplot ที่จัดกลุ่มใน r โดยใช้ ggplot2
Boxplots มีประโยชน์สำหรับการแสดงภาพข้อมูลสรุปห้าหลักของชุดข้อมูล ซึ่งรวมถึง:
- ขั้นต่ำ
- ควอไทล์แรก
- ค่ามัธยฐาน
- ควอร์ไทล์ที่สาม
- สูงสุด
ที่เกี่ยวข้อง: บทนำที่อ่อนโยนเกี่ยวกับ Boxplots
โชคดีที่การสร้าง boxplots ใน R เป็นเรื่องง่ายโดยใช้ไลบรารีการแสดงภาพ ggplot2
นอกจากนี้ยังเกี่ยวข้องกับการสร้าง boxplots ที่จัดกลุ่ม ตามตัวแปรเฉพาะในชุดข้อมูล ตัวอย่างเช่น สมมติว่าเรามีชุดข้อมูลต่อไปนี้ที่แสดงการเพิ่มประสิทธิภาพของผู้เล่นบาสเกตบอล 150 คนจากสามทีมที่แตกต่างกันตามโปรแกรมการฝึกอบรมสองโปรแกรมที่แตกต่างกัน:
#define variables team=rep(c('A', 'B', 'C'), each =50) program=rep(c('low', 'high'), each =25) increase=seq(1:150)+sample(1:100, 100, replace= TRUE ) #create dataset using variables data=data.frame(team, program, increase) #view first six rows of dataset head(data) team program increase 1 A low 62 2 A low 37 3 A low 49 4 A low 60 5 A low 64 6 A low 105
เราสามารถใช้โค้ดต่อไปนี้เพื่อสร้าง boxplots ที่แสดงการเพิ่มประสิทธิภาพของผู้เล่น จัดกลุ่มตามทีมและเติมตามตารางการฝึก:
library (ggplot2) ggplot(data, aes(x=team, y=increase, fill=program)) + geom_boxplot ()
เราสามารถใช้ไวยากรณ์ที่คล้ายกันเพื่อสร้าง boxplots ที่แสดงการเพิ่มประสิทธิภาพของผู้เล่น โดยจัดกลุ่มตามโปรแกรมการฝึกอบรมและเติมโดยทีม:
library (ggplot2) ggplot(data, aes(x=program, y=increase, fill=team)) + geom_boxplot ()
ทางเลือกที่คล้ายกันคือการใช้ faceting ซึ่งแต่ละกลุ่มย่อยจะแสดงในแผงของตัวเอง:
library (ggplot2) ggplot(data, aes(x=team, y=increase, fill=program)) + geom_boxplot () + facet_wrap (~program)
ขึ้นอยู่กับข้อมูลที่คุณใช้งาน การสร้างแง่มุมอาจหรืออาจไม่ตรงกับความต้องการด้านการแสดงภาพของคุณ
แหล่งข้อมูลเพิ่มเติม
วิธีลบค่าผิดปกติใน boxplots ใน R
วิธีสร้างแปลงแบบเคียงข้างกันใน ggplot2
คู่มือฉบับสมบูรณ์เกี่ยวกับธีม ggplot2 ที่ดีที่สุด