วิธีสร้างแผนภูมิ pareto ใน r (ทีละขั้นตอน)


แผนภูมิพาเรโต เป็นแผนภูมิประเภทหนึ่งที่แสดงความถี่ของหมวดหมู่ต่างๆ รวมถึงความถี่สะสมของหมวดหมู่ต่างๆ

แผนภูมิ Pareto ใน R

บทช่วยสอนนี้ให้ตัวอย่างทีละขั้นตอนของการสร้างแผนภูมิ Pareto ใน R

ขั้นตอนที่ 1: สร้างข้อมูล

สมมติว่าเราทำการสำรวจโดยขอให้ผู้คน 350 คนระบุแบรนด์ซีเรียลที่พวกเขาชื่นชอบระหว่างแบรนด์ A, B, C, D และ E

ชุดข้อมูลต่อไปนี้แสดงคะแนนโหวตทั้งหมดสำหรับแต่ละแบรนด์:

 #createdata
df <- data. frame (favorite=c('A', 'B', 'C', 'D', 'E', 'F'),
                 count=c(140, 97, 58, 32, 17, 6))

#viewdata
df

  favorite count
1 to 140
2 B 97
3 C 58
4 D 32
5 E 17
6 F 6

ขั้นตอนที่ 2: สร้างแผนภูมิ Pareto

หากต้องการสร้างแผนภูมิ Pareto เพื่อแสดงผลลัพธ์ของการสำรวจนี้ เราสามารถใช้ฟังก์ชัน pareto.chart() จากแพ็คเกจ qcc :

 library (qcc)

#create Pareto chart
pareto. chart (df$count)

Pareto chart analysis for df$count
     Frequency Cum.Freq. Percentage Cum.Percent.
  A 140.000000 140.000000 40.000000 40.000000
  B 97.000000 237.000000 27.714286 67.714286
  C 58.000000 295.000000 16.571429 84.285714
  D 32.000000 327.000000 9.142857 93.428571
  E 17.000000 344.000000 4.857143 98.285714
  F 6.000000 350.000000 1.714286 100.000000

ตารางผลลัพธ์จะแสดงความถี่และความถี่สะสมของแต่ละยี่ห้อ ตัวอย่างเช่น:

  • ความถี่ของแบรนด์ A: 140 | ความถี่สะสม: 140
  • ความถี่ B ของแบรนด์: 97 | ความถี่สะสมของ A, B: 237
  • ความถี่เครื่องหมาย C: 58 | ความถี่สะสมของ A, B, C: 295

และอื่นๆ

ขั้นตอนที่ 3: แก้ไขแผนภูมิ Pareto (ไม่บังคับ)

รหัสต่อไปนี้แสดงวิธีการปรับเปลี่ยนชื่อเรื่องของแผนภูมิตลอดจนจานสีที่ใช้:

 pareto. chart (df$count,
             main=' Pareto Chart for Favorite Cereal Brands ',
             col=heat. colors ( length (df$count))) 

แผนภูมิ Pareto ใน R

คุณสามารถดูรายการชุดสีทั้งหมดที่มีอยู่ใน เอกสารสรุปสี R นี้

แหล่งข้อมูลเพิ่มเติม

วิธีสร้างตารางความถี่ใน R
วิธีสร้างฮิสโตแกรมความถี่สัมพัทธ์ใน R
วิธีการคำนวณผลรวมสะสมใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *