การกระจายความถี่ที่ไม่ได้จัดกลุ่ม: คำจำกัดความและตัวอย่าง


สมมติว่าเราทำการสำรวจโดยถาม 15 ครัวเรือนว่าพวกเขามีสัตว์กี่ตัวในบ้าน ผลลัพธ์มีดังนี้:

1, 1, 1, 1, 2, 2, 2, 3, 3, 4, 5, 5, 6, 7, 8

วิธีหนึ่งในการสรุปผลลัพธ์เหล่านี้คือการสร้าง การแจกแจงความถี่ ซึ่งบอกเราว่าค่าต่างๆ ปรากฏในชุดข้อมูลบ่อยเพียงใด

เรามักจะใช้ การแจกแจงความถี่แบบคลัสเตอร์ ซึ่งเราสร้างกลุ่มของค่าแล้วสรุปจำนวนการสังเกตในชุดข้อมูลที่จัดอยู่ในกลุ่มเหล่านั้น

นี่คือตัวอย่างการกระจายความถี่แบบกลุ่มสำหรับข้อมูลการสำรวจของเรา:

ขั้นแรกเราสร้างกลุ่มขนาด 2 จากนั้นนับจำนวนการสังเกตแต่ละรายการจากชุดข้อมูลที่จัดอยู่ในแต่ละกลุ่ม ตัวอย่างเช่น:

  • 7 ครอบครัวมีสัตว์ 1 หรือ 2 ตัว
  • 3 ครอบครัวมีสัตว์ 3 หรือ 4 ตัว
  • 3 ครอบครัวมีสัตว์ 5 หรือ 6 ตัว
  • 2 ครอบครัวมีสัตว์ 7 หรือ 8 ตัว

การกระจายความถี่อีกประเภทหนึ่งที่เราสามารถสร้างได้คือ การกระจายความถี่ที่ไม่ได้จัดกลุ่ม ซึ่งจะแสดงความถี่ของค่าข้อมูลแต่ละค่าแทนที่จะเป็นกลุ่มของค่าข้อมูล

นี่คือตัวอย่างการกระจายความถี่แบบไม่คลัสเตอร์สำหรับข้อมูลการสำรวจของเรา:

ตัวอย่างการกระจายความถี่ที่ไม่ได้จัดกลุ่ม

การกระจายความถี่ประเภทนี้ช่วยให้เราเห็นได้โดยตรงว่าค่าต่างๆ ที่เกิดขึ้นในชุดข้อมูลของเราบ่อยแค่ไหน ตัวอย่างเช่น:

  • 4 ครอบครัวมีสัตว์ 1 ตัว
  • 3 ครอบครัวมีสัตว์ 2 ตัว
  • 2 ครอบครัวมีสัตว์ 3 ตัว
  • 1 ครอบครัวมีสัตว์ 4 ตัว

และอื่นๆ

เมื่อใดควรใช้การแจกแจงความถี่ที่ไม่ได้จัดกลุ่ม

การแจกแจงความถี่ที่ไม่ได้จัดกลุ่มจะมีประโยชน์เมื่อคุณต้องการดูว่าค่าแต่ละค่าปรากฏในชุดข้อมูลบ่อยแค่ไหน

โปรดทราบว่าการแจกแจงความถี่แบบไม่คลัสเตอร์จะทำงานได้ดีที่สุดกับชุดข้อมูลขนาดเล็กซึ่งมีค่าที่ไม่ซ้ำกันเพียงไม่กี่ค่าเท่านั้น

ตัวอย่างเช่น ในข้อมูลการสำรวจครั้งก่อนของเรา มีค่าที่ไม่ซ้ำกันเพียง 8 ค่า ดังนั้นจึงสมเหตุสมผลที่จะสร้างการกระจายความถี่แบบไม่คลัสเตอร์

อย่างไรก็ตาม หากเรามีชุดข้อมูลนับพันชุดที่มีค่าไม่ซ้ำกันหลายร้อยค่า การกระจายความถี่แบบไม่คลัสเตอร์จะใช้เวลานานอย่างไม่น่าเชื่อและรวบรวมข้อมูลได้ยาก

สำหรับชุดข้อมูลขนาดใหญ่ การสร้างการแจกแจงความถี่แบบจัดกลุ่มเป็นเรื่องสมเหตุสมผล

วิธีแสดงภาพการแจกแจงความถี่ที่ไม่ได้จัดกลุ่ม

วิธีที่ง่ายที่สุดในการแสดงภาพค่าในการแจกแจงความถี่ที่ไม่ได้จัดกลุ่มคือการสร้าง รูปหลายเหลี่ยมความถี่ ซึ่งแสดงความถี่ของแต่ละค่าในกราฟอย่างง่าย

รูปหลายเหลี่ยมความถี่จะมีลักษณะดังนี้สำหรับข้อมูลตัวอย่างของเรา:

รูปหลายเหลี่ยมความถี่สำหรับการกระจายความถี่ที่ไม่ได้จัดกลุ่ม

สิ่งนี้ช่วยให้เราเข้าใจได้อย่างรวดเร็วว่าแต่ละค่าปรากฏในชุดข้อมูลบ่อยแค่ไหน

อีกทางหนึ่ง เราสามารถสร้าง แผนภูมิแท่ง เพื่อแสดงข้อมูลเดียวกันโดยใช้แท่งแทนที่จะเป็นเส้นเดียว:

แผนภูมิแท่งสำหรับการกระจายความถี่ที่ไม่ได้จัดกลุ่ม

กราฟทั้งสองช่วยให้เราเข้าใจการกระจายของค่าในชุดข้อมูลของเราได้อย่างรวดเร็ว

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *