ตอบ: วิธีการเปลี่ยนจำนวนถังขยะในฮิสโตแกรม
เมื่อคุณสร้างฮิสโตแกรมใน R สูตรที่เรียกว่า กฎของ Sturges จะถูกนำมาใช้เพื่อกำหนดจำนวนกลุ่มที่เหมาะสมที่สุดที่จะใช้
อย่างไรก็ตาม คุณสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อแทนที่สูตรนี้ และระบุจำนวนกลุ่มที่แน่นอนที่จะใช้ในฮิสโตแกรม:
hist(data, breaks = seq(min(data), max(data), length. out = 7 ))
โปรดทราบว่าจำนวนกลุ่มที่ใช้ในฮิสโตแกรมจะน้อยกว่าจำนวนที่ระบุในอาร์กิวเมนต์ length.out หนึ่ง กลุ่ม
ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ
ตัวอย่างที่ 1: สร้างฮิสโตแกรมพื้นฐาน
รหัสต่อไปนี้แสดงวิธีการสร้างฮิสโตแกรมพื้นฐานใน R โดยไม่ต้องระบุจำนวนถังขยะ:
#define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)
#create histogram of data
hist(data, col = ' lightblue ')
ด้วยการใช้กฎของสเตอเจส R ตัดสินใจใช้กลุ่มทั้งหมด 8 กลุ่มในฮิสโตแกรม
ตัวอย่างที่ 2: ระบุจำนวนถังขยะที่จะใช้ในฮิสโตแกรม
รหัสต่อไปนี้แสดงวิธีสร้างฮิสโตแกรมสำหรับเวกเตอร์ข้อมูลเดียวกันและใช้ 6 กลุ่ม:
#define vector of data data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16) #create histogram with 6 bins hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 7 ))
ข้อควรระวังในการเลือกจำนวนถังขยะโดยเฉพาะ
จำนวนกลุ่มที่ใช้ในฮิสโตแกรมมีผลกระทบอย่างมากต่อวิธีที่เราตีความชุดข้อมูล
หากเราใช้กลุ่มน้อยเกินไป รูปแบบพื้นฐานที่แท้จริงในข้อมูลสามารถซ่อนได้:
#define vector of data data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16) #create histogram with 3 bins hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 4 ))
ในทางกลับกัน หากเราใช้กลุ่มมากเกินไป เราก็สามารถเห็นภาพสัญญาณรบกวนในชุดข้อมูลได้:
#define vector of data data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16) #create histogram with 15 bins hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 16 ))
โดยทั่วไป กฎ Sturges เริ่มต้นที่ใช้ใน R มีแนวโน้มที่จะสร้างฮิสโตแกรมด้วยจำนวนกลุ่มที่เหมาะสมที่สุด
คุณสามารถใช้รหัสที่ให้ไว้ที่นี่เพื่อสร้างฮิสโตแกรมที่มีจำนวนถังขยะที่แน่นอน แต่ระวังอย่าเลือกถังขยะมากเกินไปหรือน้อยเกินไป
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีการใช้งานฟังก์ชันทั่วไปอื่นๆ ด้วยฮิสโตแกรมใน R:
วิธีการพล็อตฮิสโตแกรมหลายอันใน R
วิธีสร้างฮิสโตแกรมของตัวแปรสองตัวใน R
วิธีสร้างฮิสโตแกรมความถี่สัมพัทธ์ใน R