วิธีสร้างแผนภูมิ pareto ใน r (ทีละขั้นตอน)
แผนภูมิพาเรโต เป็นแผนภูมิประเภทหนึ่งที่แสดงความถี่ของหมวดหมู่ต่างๆ รวมถึงความถี่สะสมของหมวดหมู่ต่างๆ
บทช่วยสอนนี้ให้ตัวอย่างทีละขั้นตอนของการสร้างแผนภูมิ Pareto ใน R
ขั้นตอนที่ 1: สร้างข้อมูล
สมมติว่าเราทำการสำรวจโดยขอให้ผู้คน 350 คนระบุแบรนด์ซีเรียลที่พวกเขาชื่นชอบระหว่างแบรนด์ A, B, C, D และ E
ชุดข้อมูลต่อไปนี้แสดงคะแนนโหวตทั้งหมดสำหรับแต่ละแบรนด์:
#createdata df <- data. frame (favorite=c('A', 'B', 'C', 'D', 'E', 'F'), count=c(140, 97, 58, 32, 17, 6)) #viewdata df favorite count 1 to 140 2 B 97 3 C 58 4 D 32 5 E 17 6 F 6
ขั้นตอนที่ 2: สร้างแผนภูมิ Pareto
หากต้องการสร้างแผนภูมิ Pareto เพื่อแสดงผลลัพธ์ของการสำรวจนี้ เราสามารถใช้ฟังก์ชัน pareto.chart() จากแพ็คเกจ qcc :
library (qcc) #create Pareto chart pareto. chart (df$count) Pareto chart analysis for df$count Frequency Cum.Freq. Percentage Cum.Percent. A 140.000000 140.000000 40.000000 40.000000 B 97.000000 237.000000 27.714286 67.714286 C 58.000000 295.000000 16.571429 84.285714 D 32.000000 327.000000 9.142857 93.428571 E 17.000000 344.000000 4.857143 98.285714 F 6.000000 350.000000 1.714286 100.000000
ตารางผลลัพธ์จะแสดงความถี่และความถี่สะสมของแต่ละยี่ห้อ ตัวอย่างเช่น:
- ความถี่ของแบรนด์ A: 140 | ความถี่สะสม: 140
- ความถี่ B ของแบรนด์: 97 | ความถี่สะสมของ A, B: 237
- ความถี่เครื่องหมาย C: 58 | ความถี่สะสมของ A, B, C: 295
และอื่นๆ
ขั้นตอนที่ 3: แก้ไขแผนภูมิ Pareto (ไม่บังคับ)
รหัสต่อไปนี้แสดงวิธีการปรับเปลี่ยนชื่อเรื่องของแผนภูมิตลอดจนจานสีที่ใช้:
pareto. chart (df$count, main=' Pareto Chart for Favorite Cereal Brands ', col=heat. colors ( length (df$count)))
คุณสามารถดูรายการชุดสีทั้งหมดที่มีอยู่ใน เอกสารสรุปสี R นี้
แหล่งข้อมูลเพิ่มเติม
วิธีสร้างตารางความถี่ใน R
วิธีสร้างฮิสโตแกรมความถี่สัมพัทธ์ใน R
วิธีการคำนวณผลรวมสะสมใน R