การกระจายหลายรูปแบบคืออะไร?
การแจกแจงแบบต่อเนื่องหลายรูปแบบ คือการแจกแจงความน่าจะเป็นที่มีสองรูปแบบขึ้นไป
หากคุณสร้างฮิสโตแกรมเพื่อแสดงภาพการแจกแจงแบบหลายรูปแบบ คุณจะสังเกตเห็นว่ามีจุดยอดหลายจุด:
หากการแจกแจงมีสองพีคพอดี จะถือว่าเป็นการ แจกแจงแบบไบโมดัล ซึ่งเป็นการแจกแจงแบบหลายรูปแบบเฉพาะประเภทหนึ่ง
สิ่งนี้แตกต่างกับการแจกแจงแบบ Unimodal ซึ่งมียอดเพียงจุดเดียว:
แม้ว่าการแจกแจงแบบ Unimodal เช่น การแจกแจงแบบปกติ มักใช้เพื่ออธิบายหัวข้อต่างๆ ในสถิติ แต่ในทางปฏิบัติแล้ว การแจกแจงแบบหลายรูปแบบมักปรากฏค่อนข้างบ่อย ดังนั้นจึงเป็นประโยชน์ที่จะทราบวิธีจดจำและวิเคราะห์การแจกแจงเหล่านี้
ตัวอย่างของการแจกแจงแบบต่อเนื่องหลายรูปแบบ
นี่คือตัวอย่างบางส่วนของการแจกแจงแบบหลายรูปแบบ
ตัวอย่างที่ 1: การแจกแจงผลการสอบ
สมมติว่าอาจารย์ทำข้อสอบให้ชั้นเรียนของเขา นักเรียนบางคนเรียน คนอื่นไม่ได้เรียน เมื่อศาสตราจารย์สร้างฮิสโตแกรมของคะแนนสอบ จะเป็นไปตามการแจกแจงแบบหลายรูปแบบโดยมีจุดสูงสุดประมาณคะแนนต่ำสำหรับนักเรียนที่ไม่ได้เรียน และอีกจุดสูงสุดเกี่ยวกับคะแนนสูงสำหรับนักเรียนที่เรียน:
ตัวอย่างที่ 2: ความสูงของพันธุ์พืชต่างๆ
สมมติว่านักวิทยาศาสตร์เดินไปรอบๆ สนามและวัดความสูงของพืชชนิดต่างๆ เธอวัดขนาดของสัตว์สามสายพันธุ์ที่แตกต่างกันโดยไม่รู้ตัว: ชนิดหนึ่งค่อนข้างใหญ่ อีกชนิดมีขนาดปานกลาง และอีกชนิดค่อนข้างเล็ก
เมื่อเธอสร้างฮิสโตแกรมเพื่อแสดงภาพการกระจายของความสูง เธอพบว่ามันเป็นแบบหลายรูปแบบ โดยยอดเขาแต่ละอันแสดงถึงความสูงที่พบบ่อยที่สุดของทั้งสามสายพันธุ์ที่แตกต่างกัน
ตัวอย่างที่ 3: การกระจายตัวของลูกค้า
เจ้าของร้านอาหารติดตามจำนวนลูกค้าที่มาเยี่ยมชมในแต่ละชั่วโมง เมื่อเขาสร้างฮิสโตแกรมเพื่อแสดงภาพการกระจายตัวของลูกค้า เขาเห็นว่าการกระจายเป็นแบบหลายรูปแบบ: มีจุดสูงสุดในช่วงเวลาอาหารกลางวันและอีกจุดสูงสุดในช่วงเวลาอาหารเย็น
อะไรคือสาเหตุของการแจกแจงแบบต่อเนื่องหลายรูปแบบ?
โดยปกติจะมีหนึ่งในสองสาเหตุพื้นฐานของการแจกแจงแบบต่อเนื่องหลายรูปแบบ:
1. หลายกลุ่มถูกจัดกลุ่มไว้ด้วยกัน
การแจกแจงแบบหลายรูปแบบสามารถเกิดขึ้นได้เมื่อคุณรวบรวมข้อมูลสำหรับหลายกลุ่มโดยไม่รู้ตัว
ตัวอย่างเช่น หากนักวิทยาศาสตร์วัดความสูงของพืชสามชนิดที่อยู่ในพื้นที่เดียวกันโดยไม่รู้ตัว การกระจายตัวของพืชทั้งหมดจะปรากฏหลายรูปแบบเมื่อวางไว้บนฮิสโตแกรมเดียวกัน
2. มีปรากฏการณ์ที่ซ่อนอยู่
การแจกแจงแบบต่อเนื่องหลายรูปแบบสามารถเกิดขึ้นได้เนื่องจากปรากฏการณ์พื้นฐานบางอย่าง
ตัวอย่างเช่น จำนวนลูกค้าที่มาร้านอาหารในแต่ละชั่วโมงเป็นไปตามการกระจายหลายรูปแบบ เนื่องจากผู้คนมักจะรับประทานอาหารที่ร้านอาหารในเวลาที่แตกต่างกัน 2 เวลา คือ มื้อกลางวันและมื้อเย็น พฤติกรรมมนุษย์ที่ซ่อนอยู่นี้เป็นที่มาของการกระจายแบบต่อเนื่องหลายรูปแบบ
วิธีการวิเคราะห์การแจกแจงแบบหลายรูปแบบ
เรามักจะอธิบายการแจกแจงโดยใช้ ค่าเฉลี่ยหรือค่ามัธยฐาน เพราะมันช่วยให้เราทราบว่า “ศูนย์กลาง” ของการแจกแจงอยู่ที่ไหน
น่าเสียดายที่ค่าเฉลี่ยและค่ามัธยฐานไม่มีประโยชน์ที่จะรู้สำหรับการแจกแจงแบบไบโมดัล ตัวอย่างเช่น คะแนนสอบเฉลี่ยของนักเรียนตามตัวอย่างข้างต้นคือ 81:
อย่างไรก็ตาม มีนักเรียนเพียงไม่กี่คนที่ทำคะแนนได้ใกล้ 81 ในกรณีนี้ ค่าเฉลี่ยอาจทำให้เข้าใจผิด นักเรียนส่วนใหญ่ได้คะแนนจริงประมาณ 74 หรือ 88
วิธีที่ดีกว่าในการวิเคราะห์และตีความการแจกแจงแบบไบโมดัลคือการแบ่งข้อมูลออกเป็นสองกลุ่ม จากนั้นวิเคราะห์ตำแหน่งศูนย์กลางและการกระจายสำหรับแต่ละกลุ่มแยกกัน
เช่น เราสามารถแบ่งผลการสอบเป็น “คะแนนต่ำ” และ “คะแนนสูง” แล้วหาค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของแต่ละกลุ่ม
เมื่อคำนวณสถิติสรุปสำหรับการแจกแจงที่กำหนด เช่น ค่าเฉลี่ย ค่ามัธยฐาน หรือส่วนเบี่ยงเบนมาตรฐาน อย่าลืมเห็นภาพการแจกแจงเพื่อดูว่าเป็นแบบรูปแบบเดียวหรือหลายรูปแบบ
หากการแจกแจงเป็นแบบหลายรูปแบบ การอธิบายโดยใช้ค่าเฉลี่ย ค่ามัธยฐาน หรือค่าเบี่ยงเบนมาตรฐานอาจทำให้เข้าใจผิดได้