วิธีสร้างฮิสโตแกรมความถี่สัมพัทธ์ใน r


ฮิสโตแกรมความถี่สัมพัทธ์ คือกราฟที่แสดงความถี่สัมพัทธ์ของค่าในชุดข้อมูล

บทช่วยสอนนี้จะอธิบายวิธีสร้างฮิสโตแกรมความถี่สัมพัทธ์ใน R โดยใช้ฟังก์ชันแลต ทิซ ฮิสโตแกรม () ซึ่งใช้ไวยากรณ์ต่อไปนี้:

ฮิสโตแกรม (x, ชนิด)

ทอง:

  • x: ข้อมูล
  • ประเภท: ประเภทของฮิสโตแกรมความถี่สัมพัทธ์ที่คุณต้องการสร้าง ตัวเลือกได้แก่ เปอร์เซ็นต์ จำนวน และความหนาแน่น

ฮิสโตแกรมเริ่มต้น

ขั้นแรก ให้โหลดแพ็คเกจ ขัดแตะ :

 library(lattice)

ตามค่าเริ่มต้น แพ็คเกจนี้จะสร้างฮิสโตแกรมความถี่สัมพัทธ์พร้อม เปอร์เซ็นต์ ตามแกน y:

 #create data
data <- c(0, 0, 2, 3, 4, 4, 5, 6, 7, 12, 12, 14)

#create relative frequency histogram
histogram(data) 

ฮิสโตแกรมความถี่สัมพัทธ์ใน R

การแก้ไขฮิสโตแกรม

เราสามารถแก้ไขฮิสโตแกรมเพื่อรวมชื่อ ป้ายแกนต่างๆ และสีอื่นได้โดยใช้อาร์กิวเมนต์ต่อไปนี้:

  • หลัก: ชื่อเรื่อง
  • xlab: ป้ายกำกับแกน x
  • ylab: ป้ายกำกับของแกน y
  • col: สีเติมที่จะใช้ในฮิสโตแกรม

ตัวอย่างเช่น:

 #modify the histogram
histogram(data,
          main='Points per Game by Player',
          xlab='Points per Game',
          col='steelblue')

ฮิสโตแกรมความถี่สัมพัทธ์ใน R โดยใช้แพ็คเกจโครงสร้างบังตาที่เป็นช่อง

การเปลี่ยนจำนวนถังขยะ

เราสามารถระบุจำนวนถังขยะที่จะใช้ในฮิสโตแกรมโดยใช้อาร์กิวเมนต์ ตัวแบ่ง :

 #modify the number of bins
histogram(data,
          main='Points per Game by Player',
          xlab='Points per Game',
          col='steelblue',
          breaks=15 )

ฮิสโตแกรมความถี่สัมพัทธ์พร้อมถังที่ติดตั้งใน R

ยิ่งคุณระบุหมวดหมู่มากเท่าใด คุณก็จะยิ่งได้รับข้อมูลเชิงลึกที่ละเอียดยิ่งขึ้นในข้อมูลของคุณ ในทางกลับกัน ยิ่งคุณระบุหมวดหมู่น้อยลง ข้อมูลก็จะยิ่งรวมกันมากขึ้น:

 #modify the number of bins
histogram(data,
          main='Points per Game by Player',
          xlab='Points per Game',
          col='steelblue',
          breaks=3 )

ฮิสโตแกรมความถี่สัมพัทธ์ใน R

ที่เกี่ยวข้อง: ใช้ กฎของ Sturges เพื่อระบุจำนวนกลุ่มที่เหมาะสมที่สุดเพื่อใช้ในฮิสโตแกรม

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *