Dot plot และ histogram: อะไรคือความแตกต่าง?
แผนสองแบบที่ใช้กันทั่วไปเพื่อแสดงภาพการกระจายของค่าในชุดข้อมูลคือ แผนจุด และ ฮิสโตแกรม
ดอทพล็อต จะแสดงค่าข้อมูลแต่ละค่าตามแนวแกน x และใช้จุดเพื่อแสดงความถี่ของแต่ละค่า
ฮิสโตแกรม จะแสดงช่วงข้อมูลตามแกน x และใช้แถบสี่เหลี่ยมเพื่อแสดงความถี่ของค่าที่เป็นของแต่ละช่วง
ตัวอย่างต่อไปนี้แสดงวิธีสร้างดอทพล็อตและฮิสโตแกรมสำหรับชุดข้อมูลเดียวกัน
ตัวอย่าง: การสร้าง Dot Plot และ Histogram สำหรับชุดข้อมูลเดียวกัน
สมมติว่าเรามีชุดข้อมูลต่อไปนี้ซึ่งมี 18 ค่า:
ข้อมูล: 1, 1, 1, 1, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 6, 7, 8, 10
แผนภาพจุดสำหรับชุดข้อมูลนี้จะมีลักษณะดังนี้:

แกน x แสดงค่าข้อมูลแต่ละค่า และแกน y แสดงความถี่ของแต่ละค่า
ตัวอย่างเช่น เราจะเห็นว่าค่า “2” ปรากฏขึ้นสามครั้งในชุดข้อมูลเนื่องจากมีจุดอยู่ด้านบนสามจุด ในทำนองเดียวกัน เราจะเห็นว่าค่า “3” ปรากฏเพียงครั้งเดียวเนื่องจากมีจุดด้านบนเพียงจุดเดียว
และนี่คือลักษณะของฮิสโตแกรมสำหรับชุดข้อมูลนี้:

ความเป็นระเบียบเรียบร้อย
ตัวอย่างเช่น เราจะเห็นว่าค่าเจ็ดค่าอยู่ระหว่าง 0 ถึง 2 สองค่าอยู่ระหว่าง 2 ถึง 4 เป็นต้น
โบนัส : สำหรับผู้ที่สงสัย เราใช้โค้ด R ต่อไปนี้เพื่อสร้าง dot plot และฮิสโตแกรมที่แสดงด้านบน:
#define dataset data <- c(1, 1, 1, 1, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 6, 7, 8, 10) #create dot plot stripchart(data, method = "stack", offset = .5, at = 0, pch = 19, cex=5, col = "steelblue", main = "Dot Plot", xlab = "Data Values", ylab="Frequency") #create histogram hist(data, col='steelblue', main='Histogram', xlab='Data Values')
Dot Plot หรือ Histogram: คุณควรใช้อันไหน
ดังที่ได้กล่าวไว้ข้างต้น สามารถใช้ dot plot และ histogram เพื่อแสดงภาพการกระจายของค่าในชุดข้อมูลได้
ตามหลักทั่วไปแล้ว เรามักจะใช้ dot plot เมื่อชุดข้อมูลของเรามีขนาดเล็ก เนื่องจากช่วยให้เราเห็นได้อย่างชัดเจนว่าค่าแต่ละค่าปรากฏขึ้นกี่ครั้ง
ในทางกลับกัน เรามักจะใช้ฮิสโตแกรมเมื่อชุดข้อมูลของเรามีขนาดใหญ่ เนื่องจากการสร้างจุดเพื่อแสดงค่าแต่ละค่าในชุดข้อมูลขนาดใหญ่นั้นน่าเบื่อ
โปรดทราบว่าข้อเสียเพียงอย่างเดียวของการใช้ฮิสโตแกรมก็คือ เราไม่สามารถบอกได้อย่างแน่ชัดว่าค่าแต่ละค่าปรากฏกี่ครั้ง
ตัวอย่างเช่น ในฮิสโตแกรมก่อนหน้านี้ เราเห็นว่าค่าเจ็ดค่าอยู่ระหว่าง 0 ถึง 2 แต่เราไม่ทราบแน่ชัดว่า 1 มีกี่ค่า และ 2 มีกี่ค่า

หากเราเพียงต้องการเข้าใจ “รูปร่าง” ทั่วไปของการแจกแจง โดยทั่วไปแล้วไม่สำคัญว่าเราไม่ทราบค่าแต่ละค่าของชุดข้อมูลหรือไม่
นอกจากนี้ โปรดทราบว่าเราไม่สามารถคำนวณค่ามัธยฐานหรือค่าเฉลี่ยที่แน่นอนโดยดูจากฮิสโตแกรมได้ เนื่องจากเราไม่ทราบค่าแต่ละค่า
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับฮิสโตแกรม:
วิธีประมาณค่าฮิสโตแกรมเฉลี่ยและค่ามัธยฐาน
วิธีอธิบายรูปร่างของฮิสโตแกรม
วิธีสร้างฮิสโตแกรมใน R
วิธีสร้างฮิสโตแกรมใน Python
บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับจุดพล็อต:
วิธีค้นหาจุดศูนย์กลางและการแพร่กระจายของดอทพล็อต
วิธีสร้าง Dot Plot ใน Google ชีต
วิธีสร้าง Dot Plot ใน Excel
วิธีสร้าง Dot Plot ใน R