Dot plot และ histogram: อะไรคือความแตกต่าง?


แผนสองแบบที่ใช้กันทั่วไปเพื่อแสดงภาพการกระจายของค่าในชุดข้อมูลคือ แผนจุด และ ฮิสโตแกรม

ดอทพล็อต จะแสดงค่าข้อมูลแต่ละค่าตามแนวแกน x และใช้จุดเพื่อแสดงความถี่ของแต่ละค่า

ฮิสโตแกรม จะแสดงช่วงข้อมูลตามแกน x และใช้แถบสี่เหลี่ยมเพื่อแสดงความถี่ของค่าที่เป็นของแต่ละช่วง

ตัวอย่างต่อไปนี้แสดงวิธีสร้างดอทพล็อตและฮิสโตแกรมสำหรับชุดข้อมูลเดียวกัน

ตัวอย่าง: การสร้าง Dot Plot และ Histogram สำหรับชุดข้อมูลเดียวกัน

สมมติว่าเรามีชุดข้อมูลต่อไปนี้ซึ่งมี 18 ค่า:

ข้อมูล: 1, 1, 1, 1, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 6, 7, 8, 10

แผนภาพจุดสำหรับชุดข้อมูลนี้จะมีลักษณะดังนี้:

แกน x แสดงค่าข้อมูลแต่ละค่า และแกน y แสดงความถี่ของแต่ละค่า

ตัวอย่างเช่น เราจะเห็นว่าค่า “2” ปรากฏขึ้นสามครั้งในชุดข้อมูลเนื่องจากมีจุดอยู่ด้านบนสามจุด ในทำนองเดียวกัน เราจะเห็นว่าค่า “3” ปรากฏเพียงครั้งเดียวเนื่องจากมีจุดด้านบนเพียงจุดเดียว

และนี่คือลักษณะของฮิสโตแกรมสำหรับชุดข้อมูลนี้:

ความเป็นระเบียบเรียบร้อย

ตัวอย่างเช่น เราจะเห็นว่าค่าเจ็ดค่าอยู่ระหว่าง 0 ถึง 2 สองค่าอยู่ระหว่าง 2 ถึง 4 เป็นต้น

โบนัส : สำหรับผู้ที่สงสัย เราใช้โค้ด R ต่อไปนี้เพื่อสร้าง dot plot และฮิสโตแกรมที่แสดงด้านบน:

 #define dataset
data <- c(1, 1, 1, 1, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 6, 7, 8, 10)

#create dot plot
stripchart(data, method = "stack", offset = .5, at = 0, pch = 19, cex=5,
           col = "steelblue", main = "Dot Plot",
           xlab = "Data Values", ylab="Frequency")

#create histogram
hist(data, col='steelblue', main='Histogram', xlab='Data Values')

Dot Plot หรือ Histogram: คุณควรใช้อันไหน

ดังที่ได้กล่าวไว้ข้างต้น สามารถใช้ dot plot และ histogram เพื่อแสดงภาพการกระจายของค่าในชุดข้อมูลได้

ตามหลักทั่วไปแล้ว เรามักจะใช้ dot plot เมื่อชุดข้อมูลของเรามีขนาดเล็ก เนื่องจากช่วยให้เราเห็นได้อย่างชัดเจนว่าค่าแต่ละค่าปรากฏขึ้นกี่ครั้ง

ในทางกลับกัน เรามักจะใช้ฮิสโตแกรมเมื่อชุดข้อมูลของเรามีขนาดใหญ่ เนื่องจากการสร้างจุดเพื่อแสดงค่าแต่ละค่าในชุดข้อมูลขนาดใหญ่นั้นน่าเบื่อ

โปรดทราบว่าข้อเสียเพียงอย่างเดียวของการใช้ฮิสโตแกรมก็คือ เราไม่สามารถบอกได้อย่างแน่ชัดว่าค่าแต่ละค่าปรากฏกี่ครั้ง

ตัวอย่างเช่น ในฮิสโตแกรมก่อนหน้านี้ เราเห็นว่าค่าเจ็ดค่าอยู่ระหว่าง 0 ถึง 2 แต่เราไม่ทราบแน่ชัดว่า 1 มีกี่ค่า และ 2 มีกี่ค่า

หากเราเพียงต้องการเข้าใจ “รูปร่าง” ทั่วไปของการแจกแจง โดยทั่วไปแล้วไม่สำคัญว่าเราไม่ทราบค่าแต่ละค่าของชุดข้อมูลหรือไม่

นอกจากนี้ โปรดทราบว่าเราไม่สามารถคำนวณค่ามัธยฐานหรือค่าเฉลี่ยที่แน่นอนโดยดูจากฮิสโตแกรมได้ เนื่องจากเราไม่ทราบค่าแต่ละค่า

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับฮิสโตแกรม:

วิธีประมาณค่าฮิสโตแกรมเฉลี่ยและค่ามัธยฐาน
วิธีอธิบายรูปร่างของฮิสโตแกรม
วิธีสร้างฮิสโตแกรมใน R
วิธีสร้างฮิสโตแกรมใน Python

บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับจุดพล็อต:

วิธีค้นหาจุดศูนย์กลางและการแพร่กระจายของดอทพล็อต
วิธีสร้าง Dot Plot ใน Google ชีต
วิธีสร้าง Dot Plot ใน Excel
วิธีสร้าง Dot Plot ใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *