ตอบ: วิธีการเปลี่ยนจำนวนถังขยะในฮิสโตแกรม


เมื่อคุณสร้างฮิสโตแกรมใน R สูตรที่เรียกว่า กฎของ Sturges จะถูกนำมาใช้เพื่อกำหนดจำนวนกลุ่มที่เหมาะสมที่สุดที่จะใช้

อย่างไรก็ตาม คุณสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อแทนที่สูตรนี้ และระบุจำนวนกลุ่มที่แน่นอนที่จะใช้ในฮิสโตแกรม:

 hist(data, breaks = seq(min(data), max(data), length. out = 7 ))

โปรดทราบว่าจำนวนกลุ่มที่ใช้ในฮิสโตแกรมจะน้อยกว่าจำนวนที่ระบุในอาร์กิวเมนต์ length.out หนึ่ง กลุ่ม

ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ

ตัวอย่างที่ 1: สร้างฮิสโตแกรมพื้นฐาน

รหัสต่อไปนี้แสดงวิธีการสร้างฮิสโตแกรมพื้นฐานใน R โดยไม่ต้องระบุจำนวนถังขยะ:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram of data
hist(data, col = ' lightblue ') 

ด้วยการใช้กฎของสเตอเจส R ตัดสินใจใช้กลุ่มทั้งหมด 8 กลุ่มในฮิสโตแกรม

ตัวอย่างที่ 2: ระบุจำนวนถังขยะที่จะใช้ในฮิสโตแกรม

รหัสต่อไปนี้แสดงวิธีสร้างฮิสโตแกรมสำหรับเวกเตอร์ข้อมูลเดียวกันและใช้ 6 กลุ่ม:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 6 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 7 )) 

ข้อควรระวังในการเลือกจำนวนถังขยะโดยเฉพาะ

จำนวนกลุ่มที่ใช้ในฮิสโตแกรมมีผลกระทบอย่างมากต่อวิธีที่เราตีความชุดข้อมูล

หากเราใช้กลุ่มน้อยเกินไป รูปแบบพื้นฐานที่แท้จริงในข้อมูลสามารถซ่อนได้:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 3 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 4 )) 

ในทางกลับกัน หากเราใช้กลุ่มมากเกินไป เราก็สามารถเห็นภาพสัญญาณรบกวนในชุดข้อมูลได้:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 15 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 16 )) 

โดยทั่วไป กฎ Sturges เริ่มต้นที่ใช้ใน R มีแนวโน้มที่จะสร้างฮิสโตแกรมด้วยจำนวนกลุ่มที่เหมาะสมที่สุด

คุณสามารถใช้รหัสที่ให้ไว้ที่นี่เพื่อสร้างฮิสโตแกรมที่มีจำนวนถังขยะที่แน่นอน แต่ระวังอย่าเลือกถังขยะมากเกินไปหรือน้อยเกินไป

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีการใช้งานฟังก์ชันทั่วไปอื่นๆ ด้วยฮิสโตแกรมใน R:

วิธีการพล็อตฮิสโตแกรมหลายอันใน R
วิธีสร้างฮิสโตแกรมของตัวแปรสองตัวใน R
วิธีสร้างฮิสโตแกรมความถี่สัมพัทธ์ใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *