การกระจายความถี่สัมพัทธ์คืออะไร?
การกระจายความถี่ จะอธิบายว่าค่าที่แตกต่างกันปรากฏในชุดข้อมูลบ่อยแค่ไหน
ตัวอย่างเช่น สมมติว่าเรา สุ่มตัวอย่างง่ายๆ จำนวน 400 ครัวเรือนในเมืองหนึ่ง และบันทึกจำนวนสัตว์เลี้ยงในแต่ละครัวเรือน ตารางต่อไปนี้แสดงผลลัพธ์:

ตารางนี้แสดงถึงการกระจายความถี่
การแจกแจงที่เกี่ยวข้องเรียกว่า การแจกแจงความถี่สัมพัทธ์ ซึ่งแสดงความถี่สัมพัทธ์ของแต่ละค่าในชุดข้อมูลเป็นเปอร์เซ็นต์ของความถี่ทั้งหมด
เช่น ในตารางที่แล้ว เราเห็นว่ามีทั้งหมด 400 ครัวเรือน หากต้องการค้นหาความถี่สัมพัทธ์ของแต่ละค่าในการแจกแจง เราเพียงหารแต่ละความถี่ด้วย 400:

โปรดทราบว่าการแจกแจงความถี่สัมพัทธ์มีคุณสมบัติดังต่อไปนี้:
- ความถี่สัมพัทธ์แต่ละรายการมีตั้งแต่ 0% ถึง 100%
- ผลรวมของความถี่สัมพัทธ์แต่ละรายการรวมกันได้ 100%
หากไม่ตรงตามเงื่อนไขเหล่านี้ แสดงว่าการแจกแจงความถี่สัมพัทธ์ไม่ถูกต้อง
เหตุใดการแจกแจงความถี่สัมพัทธ์จึงมีประโยชน์
การแจกแจงความถี่สัมพัทธ์มีประโยชน์เนื่องจากช่วยให้เราเข้าใจว่าค่าในชุดข้อมูลมีความเหมือนกันเพียงใดเมื่อเปรียบเทียบกับค่าอื่นๆ ทั้งหมด
ในตัวอย่างก่อนหน้านี้ เราพบว่า 150 ครัวเรือนมีสัตว์เลี้ยงเพียงตัวเดียว แต่ตัวเลขนี้โดยตัวมันเองไม่ได้มีประโยชน์อย่างยิ่ง
แต่จะมีประโยชน์มากกว่าหากรู้ว่า 37.5% ของครัวเรือนทั้งหมดในกลุ่มตัวอย่างมีสัตว์เลี้ยงเพียงตัวเดียว สิ่งนี้ช่วยให้เราเข้าใจว่ามากกว่าหนึ่งในสามครัวเรือนมีสัตว์เลี้ยงเพียงตัวเดียวเท่านั้น ซึ่งทำให้เรารู้ว่าการเลี้ยงสัตว์เลี้ยงตัวเดียวนั้น “เป็นเรื่องธรรมดา” อย่างไร
การแสดงภาพการแจกแจงความถี่สัมพัทธ์
วิธีที่พบบ่อยที่สุดในการมองเห็นการแจกแจงความถี่สัมพัทธ์คือการสร้าง ฮิสโตแกรมความถี่สัมพัทธ์ ซึ่งแสดงค่าข้อมูลแต่ละรายการตามแกน x ของกราฟ และใช้แท่งเพื่อแสดงความถี่สัมพัทธ์ของแต่ละคลาสตามแนวแกน y
ตัวอย่างเช่น นี่คือลักษณะของฮิสโตแกรมความถี่สัมพัทธ์สำหรับข้อมูลจากตัวอย่างก่อนหน้านี้:

แกน x จะแสดงจำนวนสัตว์เลี้ยงในครัวเรือน และแกน y จะแสดงความถี่สัมพัทธ์ของครัวเรือนที่เป็นเจ้าของสัตว์เลี้ยงจำนวนนั้น
ฮิสโตแกรมนี้เป็นวิธีที่มีประโยชน์ในการแสดงภาพการแจกแจงความถี่สัมพัทธ์
แหล่งข้อมูลเพิ่มเติม
เครื่องคำนวณความถี่สัมพัทธ์
วิธีการคำนวณความถี่สัมพัทธ์ใน Excel
วิธีการคำนวณความถี่สัมพัทธ์ใน Python
วิธีสร้างฮิสโตแกรมความถี่สัมพัทธ์ใน R