การกระจายหลายรูปแบบคืออะไร?


การแจกแจงแบบต่อเนื่องหลายรูปแบบ คือการแจกแจงความน่าจะเป็นที่มีสองรูปแบบขึ้นไป

หากคุณสร้างฮิสโตแกรมเพื่อแสดงภาพการแจกแจงแบบหลายรูปแบบ คุณจะสังเกตเห็นว่ามีจุดยอดหลายจุด:

การกระจายหลายรูปแบบ

หากการแจกแจงมีสองพีคพอดี จะถือว่าเป็นการ แจกแจงแบบไบโมดัล ซึ่งเป็นการแจกแจงแบบหลายรูปแบบเฉพาะประเภทหนึ่ง

สิ่งนี้แตกต่างกับการแจกแจงแบบ Unimodal ซึ่งมียอดเพียงจุดเดียว:

แม้ว่าการแจกแจงแบบ Unimodal เช่น การแจกแจงแบบปกติ มักใช้เพื่ออธิบายหัวข้อต่างๆ ในสถิติ แต่ในทางปฏิบัติแล้ว การแจกแจงแบบหลายรูปแบบมักปรากฏค่อนข้างบ่อย ดังนั้นจึงเป็นประโยชน์ที่จะทราบวิธีจดจำและวิเคราะห์การแจกแจงเหล่านี้

ตัวอย่างของการแจกแจงแบบต่อเนื่องหลายรูปแบบ

นี่คือตัวอย่างบางส่วนของการแจกแจงแบบหลายรูปแบบ

ตัวอย่างที่ 1: การแจกแจงผลการสอบ

สมมติว่าอาจารย์ทำข้อสอบให้ชั้นเรียนของเขา นักเรียนบางคนเรียน คนอื่นไม่ได้เรียน เมื่อศาสตราจารย์สร้างฮิสโตแกรมของคะแนนสอบ จะเป็นไปตามการแจกแจงแบบหลายรูปแบบโดยมีจุดสูงสุดประมาณคะแนนต่ำสำหรับนักเรียนที่ไม่ได้เรียน และอีกจุดสูงสุดเกี่ยวกับคะแนนสูงสำหรับนักเรียนที่เรียน:

ตัวอย่างการกระจายหลายรูปแบบ

ตัวอย่างที่ 2: ความสูงของพันธุ์พืชต่างๆ

สมมติว่านักวิทยาศาสตร์เดินไปรอบๆ สนามและวัดความสูงของพืชชนิดต่างๆ เธอวัดขนาดของสัตว์สามสายพันธุ์ที่แตกต่างกันโดยไม่รู้ตัว: ชนิดหนึ่งค่อนข้างใหญ่ อีกชนิดมีขนาดปานกลาง และอีกชนิดค่อนข้างเล็ก

เมื่อเธอสร้างฮิสโตแกรมเพื่อแสดงภาพการกระจายของความสูง เธอพบว่ามันเป็นแบบหลายรูปแบบ โดยยอดเขาแต่ละอันแสดงถึงความสูงที่พบบ่อยที่สุดของทั้งสามสายพันธุ์ที่แตกต่างกัน

ตัวอย่างการกระจายหลายรูปแบบ

ตัวอย่างที่ 3: การกระจายตัวของลูกค้า

เจ้าของร้านอาหารติดตามจำนวนลูกค้าที่มาเยี่ยมชมในแต่ละชั่วโมง เมื่อเขาสร้างฮิสโตแกรมเพื่อแสดงภาพการกระจายตัวของลูกค้า เขาเห็นว่าการกระจายเป็นแบบหลายรูปแบบ: มีจุดสูงสุดในช่วงเวลาอาหารกลางวันและอีกจุดสูงสุดในช่วงเวลาอาหารเย็น

อะไรคือสาเหตุของการแจกแจงแบบต่อเนื่องหลายรูปแบบ?

โดยปกติจะมีหนึ่งในสองสาเหตุพื้นฐานของการแจกแจงแบบต่อเนื่องหลายรูปแบบ:

1. หลายกลุ่มถูกจัดกลุ่มไว้ด้วยกัน

การแจกแจงแบบหลายรูปแบบสามารถเกิดขึ้นได้เมื่อคุณรวบรวมข้อมูลสำหรับหลายกลุ่มโดยไม่รู้ตัว

ตัวอย่างเช่น หากนักวิทยาศาสตร์วัดความสูงของพืชสามชนิดที่อยู่ในพื้นที่เดียวกันโดยไม่รู้ตัว การกระจายตัวของพืชทั้งหมดจะปรากฏหลายรูปแบบเมื่อวางไว้บนฮิสโตแกรมเดียวกัน

2. มีปรากฏการณ์ที่ซ่อนอยู่

การแจกแจงแบบต่อเนื่องหลายรูปแบบสามารถเกิดขึ้นได้เนื่องจากปรากฏการณ์พื้นฐานบางอย่าง

ตัวอย่างเช่น จำนวนลูกค้าที่มาร้านอาหารในแต่ละชั่วโมงเป็นไปตามการกระจายหลายรูปแบบ เนื่องจากผู้คนมักจะรับประทานอาหารที่ร้านอาหารในเวลาที่แตกต่างกัน 2 เวลา คือ มื้อกลางวันและมื้อเย็น พฤติกรรมมนุษย์ที่ซ่อนอยู่นี้เป็นที่มาของการกระจายแบบต่อเนื่องหลายรูปแบบ

วิธีการวิเคราะห์การแจกแจงแบบหลายรูปแบบ

เรามักจะอธิบายการแจกแจงโดยใช้ ค่าเฉลี่ยหรือค่ามัธยฐาน เพราะมันช่วยให้เราทราบว่า “ศูนย์กลาง” ของการแจกแจงอยู่ที่ไหน

น่าเสียดายที่ค่าเฉลี่ยและค่ามัธยฐานไม่มีประโยชน์ที่จะรู้สำหรับการแจกแจงแบบไบโมดัล ตัวอย่างเช่น คะแนนสอบเฉลี่ยของนักเรียนตามตัวอย่างข้างต้นคือ 81:

อย่างไรก็ตาม มีนักเรียนเพียงไม่กี่คนที่ทำคะแนนได้ใกล้ 81 ในกรณีนี้ ค่าเฉลี่ยอาจทำให้เข้าใจผิด นักเรียนส่วนใหญ่ได้คะแนนจริงประมาณ 74 หรือ 88

วิธีที่ดีกว่าในการวิเคราะห์และตีความการแจกแจงแบบไบโมดัลคือการแบ่งข้อมูลออกเป็นสองกลุ่ม จากนั้นวิเคราะห์ตำแหน่งศูนย์กลางและการกระจายสำหรับแต่ละกลุ่มแยกกัน

เช่น เราสามารถแบ่งผลการสอบเป็น “คะแนนต่ำ” และ “คะแนนสูง” แล้วหาค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของแต่ละกลุ่ม

เมื่อคำนวณสถิติสรุปสำหรับการแจกแจงที่กำหนด เช่น ค่าเฉลี่ย ค่ามัธยฐาน หรือส่วนเบี่ยงเบนมาตรฐาน อย่าลืมเห็นภาพการแจกแจงเพื่อดูว่าเป็นแบบรูปแบบเดียวหรือหลายรูปแบบ

หากการแจกแจงเป็นแบบหลายรูปแบบ การอธิบายโดยใช้ค่าเฉลี่ย ค่ามัธยฐาน หรือค่าเบี่ยงเบนมาตรฐานอาจทำให้เข้าใจผิดได้

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *