วิธีการสร้างการแจกแจงแบบปกติใน r (พร้อมตัวอย่าง)


คุณสามารถสร้าง การแจกแจงแบบปกติ ใน R ได้อย่างรวดเร็วโดยใช้ฟังก์ชัน rnorm() ซึ่งใช้ไวยากรณ์ต่อไปนี้:

 rnorm(n, mean=0, sd=1)

ทอง:

  • n: จำนวนการสังเกต
  • ค่าเฉลี่ย: ค่าเฉลี่ยของการแจกแจงแบบปกติ ค่าเริ่มต้นคือ 0
  • sd: ค่าเบี่ยงเบนมาตรฐานของการแจกแจงแบบปกติ ค่าเริ่มต้นคือ 1

บทช่วยสอนนี้แสดงตัวอย่างการใช้ฟังก์ชันนี้เพื่อสร้างการแจกแจงแบบปกติใน R

ที่เกี่ยวข้อง: คำแนะนำเกี่ยวกับ dnorm, pnorm, qnorm และ rnorm ใน R

ตัวอย่าง: การสร้างการแจกแจงแบบปกติใน R

รหัสต่อไปนี้แสดงวิธีการสร้างการแจกแจงแบบปกติใน R:

 #make this example reproducible
set.seed(1)

#generate sample of 200 obs. that follows normal dist. with mean=10 and sd=3
data <- rnorm(200, mean=10, sd=3)

#view first 6 observations in sample
head(data)

[1] 8.120639 10.550930 7.493114 14.785842 10.988523 7.538595

เราสามารถหาค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของการแจกแจงนี้ได้อย่างรวดเร็ว:

 #find mean of sample
mean(data)

[1] 10.10662

#find standard deviation of sample
sd(data)

[1] 2.787292

นอกจากนี้เรายังสามารถสร้างฮิสโตแกรมด่วนเพื่อแสดงภาพการกระจายของค่าข้อมูลได้:

 hist(data, col=' steelblue ')

สร้างการแจกแจงแบบปกติใน R

เรายังสามารถทำการ ทดสอบ Shapiro-Wilk เพื่อดูว่าชุดข้อมูลมาจากประชากรปกติหรือไม่:

 shapiro.test(data)

	Shapiro-Wilk normality test

data:data
W = 0.99274, p-value = 0.4272

ค่า p ของการทดสอบกลายเป็น 0.4272 . เนื่องจากค่านี้ไม่น้อยกว่า 0.05 เราจึงสามารถสรุปได้ว่าข้อมูลตัวอย่างมาจากประชากรที่มีการกระจายแบบปกติ

ผลลัพธ์นี้ไม่น่าประหลาดใจเนื่องจากเราสร้างข้อมูลโดยใช้ฟังก์ชัน rnorm() ซึ่งโดยธรรมชาติแล้วจะสร้างตัวอย่างข้อมูลแบบสุ่มจากการแจกแจงแบบปกติ

แหล่งข้อมูลเพิ่มเติม

วิธีการพล็อตการแจกแจงแบบปกติใน R
คำแนะนำเกี่ยวกับ dnorm, pnorm, qnorm และ rnorm ใน R
วิธีทำการทดสอบ Shapiro-Wilk เพื่อความปกติใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *