เส้นโค้งความหนาแน่นคืออะไร? (คำอธิบายและตัวอย่าง)


เส้นโค้งความหนาแน่น คือเส้นโค้งบนกราฟที่แสดงการกระจายของค่าในชุดข้อมูล สิ่งนี้มีประโยชน์ด้วยเหตุผลสามประการ:

1. เส้นโค้งความหนาแน่นทำให้เรามีความคิดที่ดีเกี่ยวกับ “รูปร่าง” ของการแจกแจง รวมถึงการแจกแจงที่มีค่าความถี่ “พีค” อย่างน้อยหนึ่งค่าหรือไม่ และการกระจายนั้นเบ้ไปทางซ้ายหรือไม่ หรือถูก. ขวา. .

2. เส้นโค้งความหนาแน่นช่วยให้เรามองเห็นได้ว่า ค่าเฉลี่ยและค่ามัธยฐาน ของการแจกแจงสัมพันธ์กันอย่างไร

3. เส้นโค้งความหนาแน่นช่วยให้เรามองเห็นเปอร์เซ็นต์ของการสังเกตในชุดข้อมูลที่อยู่ระหว่างค่าที่ต่างกัน

เส้นโค้งความหนาแน่นที่รู้จักกันดีที่สุดคือเส้นโค้งรูประฆังซึ่งแสดงถึง การกระจายตัวแบบปกติ

เพื่อให้เข้าใจเส้นโค้งความหนาแน่นได้ดีขึ้น ลองพิจารณาตัวอย่างต่อไปนี้

ตัวอย่าง: การสร้างและการตีความเส้นโค้งความหนาแน่น

สมมติว่าเรามีชุดข้อมูลต่อไปนี้ที่แสดงความสูงของต้นที่แตกต่างกัน 20 ต้น (เป็นนิ้ว) ในบางฟิลด์:

4, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8, 8, 9, 9, 9, 2, 2

หากเราสร้างฮิสโตแกรมอย่างง่ายเพื่อแสดงความถี่สัมพัทธ์ของแต่ละค่า มันจะมีลักษณะดังนี้:

ฮิสโตแกรมความถี่สัมพัทธ์ใน R

แกน x แสดงค่าข้อมูล และแกน y แสดงความถี่สัมพัทธ์ (เช่น ค่า “7” ปรากฏ 5 ครั้งจากทั้งหมด 20 ค่าในชุดข้อมูล จึงมีความถี่สัมพัทธ์ 25% หรือ 0.25 .

และถ้าเราสร้าง เส้นโค้งความหนาแน่น เพื่อจับ “รูปร่าง” ของการกระจายตัวนี้ มันจะมีลักษณะดังนี้:

ตัวอย่างเส้นโค้งความหนาแน่น

เส้นโค้งจะอยู่สูงที่สุดใกล้กับศูนย์กลางของการแจกแจงเพราะนั่นคือจุดที่พบค่าส่วนใหญ่ นอกจากนี้ยังต่ำที่สุดเมื่อใกล้ถึงจุดสิ้นสุดของการกระจายเนื่องจากมีพืชน้อยกว่าที่ใช้ค่าเหล่านี้ (เช่น ความสูง 4 นิ้วหรือ 10 นิ้ว)

วิธีการตีความเส้นโค้งความหนาแน่น

เส้นโค้งความหนาแน่นมาในรูปทรงและขนาดต่างๆ และช่วยให้เราเข้าใจการกระจายของค่าในชุดข้อมูลที่กำหนดได้อย่างรวดเร็ว มีประโยชน์อย่างยิ่งในการช่วยให้เราเห็นภาพ:

1. ความไม่สมมาตร

ความเบ้เป็นวิธีหนึ่งในการอธิบายความสมมาตรของการแจกแจง เส้นโค้งความหนาแน่นช่วยให้เราเห็นได้อย่างรวดเร็วว่ากราฟเอียงไปทางซ้าย ขวา หรือไม่มีความเอียง:

ตัวอย่างเส้นโค้งความหนาแน่นเบ้ซ้าย

ตัวอย่างเส้นโค้งความหนาแน่นเอียงขวา

ตัวอย่างเส้นโค้งความหนาแน่นแบบสมมาตร

2. ตำแหน่งของค่าเฉลี่ยและค่ามัธยฐาน

จากความเบ้ของเส้นโค้งความหนาแน่น เราสามารถบอกได้อย่างรวดเร็วว่าค่าเฉลี่ยหรือค่ามัธยฐานมีค่ามากกว่าในการแจกแจงที่กำหนด โดยเฉพาะ:

  • หากเส้นโค้งความหนาแน่น ยังคงไม่สมมาตร แสดงว่าค่าเฉลี่ยจะ ต่ำกว่า ค่ามัธยฐาน
  • หากเส้นโค้งความหนาแน่น เอียงไปทางขวา แสดงว่าค่าเฉลี่ยจะ มากกว่า ค่ามัธยฐาน
  • หากเส้นโค้งความหนาแน่น ไม่มีความไม่สมมาตร ค่าเฉลี่ยจะ เท่ากับ ค่ามัธยฐาน

3. จำนวนพีค

เส้นโค้งความหนาแน่นยังช่วยให้เราเห็นได้อย่างรวดเร็วว่ามี “ยอด” จำนวนเท่าใดในการแจกแจงที่กำหนด ในแต่ละตัวอย่างข้างต้น การแจกแจงมียอดเพียงจุดเดียว ดังนั้นเราจะอธิบายการแจกแจงเหล่านี้เป็น แบบยูนิโมดัล

อย่างไรก็ตาม การแจกแจงบางแบบอาจมีพีคสองค่าซึ่งเราเรียกว่า การแจกแจงแบบไบโมดัล และในบางกรณีที่เกิดขึ้นไม่บ่อยนัก เราก็สามารถมี การแจกแจง แบบหลายรูป แบบที่มียอดสองค่าขึ้นไปได้

เพียงสร้างกราฟความหนาแน่นสำหรับชุดข้อมูลที่กำหนด เราก็สามารถดูจำนวนพีคในการแจกแจงได้อย่างรวดเร็ว

คุณสมบัติของเส้นโค้งความหนาแน่น

เส้นโค้งความหนาแน่นมีคุณสมบัติดังต่อไปนี้:

  • พื้นที่ใต้เส้นโค้งจะรวมกันได้ 100% เสมอ
  • เส้นโค้งจะไม่ต่ำกว่าแกน x

โปรดคำนึงถึงข้อเท็จจริงทั้งสองนี้เมื่อสร้างหรือตีความเส้นโค้งความหนาแน่นสำหรับการแจกแจงที่แตกต่างกัน

แหล่งข้อมูลเพิ่มเติม

รู้เบื้องต้นเกี่ยวกับฮิสโตแกรมความถี่สัมพัทธ์
วิธีการสร้างเส้นโค้งระฆังใน Excel
วิธีสร้าง Bell Curve ใน Python

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *