วิธีการสร้างการแจกแจงแบบปกติใน r (พร้อมตัวอย่าง)
คุณสามารถสร้าง การแจกแจงแบบปกติ ใน R ได้อย่างรวดเร็วโดยใช้ฟังก์ชัน rnorm() ซึ่งใช้ไวยากรณ์ต่อไปนี้:
rnorm(n, mean=0, sd=1)
ทอง:
- n: จำนวนการสังเกต
- ค่าเฉลี่ย: ค่าเฉลี่ยของการแจกแจงแบบปกติ ค่าเริ่มต้นคือ 0
- sd: ค่าเบี่ยงเบนมาตรฐานของการแจกแจงแบบปกติ ค่าเริ่มต้นคือ 1
บทช่วยสอนนี้แสดงตัวอย่างการใช้ฟังก์ชันนี้เพื่อสร้างการแจกแจงแบบปกติใน R
ที่เกี่ยวข้อง: คำแนะนำเกี่ยวกับ dnorm, pnorm, qnorm และ rnorm ใน R
ตัวอย่าง: การสร้างการแจกแจงแบบปกติใน R
รหัสต่อไปนี้แสดงวิธีการสร้างการแจกแจงแบบปกติใน R:
#make this example reproducible set.seed(1) #generate sample of 200 obs. that follows normal dist. with mean=10 and sd=3 data <- rnorm(200, mean=10, sd=3) #view first 6 observations in sample head(data) [1] 8.120639 10.550930 7.493114 14.785842 10.988523 7.538595
เราสามารถหาค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของการแจกแจงนี้ได้อย่างรวดเร็ว:
#find mean of sample
mean(data)
[1] 10.10662
#find standard deviation of sample
sd(data)
[1] 2.787292
นอกจากนี้เรายังสามารถสร้างฮิสโตแกรมด่วนเพื่อแสดงภาพการกระจายของค่าข้อมูลได้:
hist(data, col=' steelblue ')

เรายังสามารถทำการ ทดสอบ Shapiro-Wilk เพื่อดูว่าชุดข้อมูลมาจากประชากรปกติหรือไม่:
shapiro.test(data)
Shapiro-Wilk normality test
data:data
W = 0.99274, p-value = 0.4272
ค่า p ของการทดสอบกลายเป็น 0.4272 . เนื่องจากค่านี้ไม่น้อยกว่า 0.05 เราจึงสามารถสรุปได้ว่าข้อมูลตัวอย่างมาจากประชากรที่มีการกระจายแบบปกติ
ผลลัพธ์นี้ไม่น่าประหลาดใจเนื่องจากเราสร้างข้อมูลโดยใช้ฟังก์ชัน rnorm() ซึ่งโดยธรรมชาติแล้วจะสร้างตัวอย่างข้อมูลแบบสุ่มจากการแจกแจงแบบปกติ
แหล่งข้อมูลเพิ่มเติม
วิธีการพล็อตการแจกแจงแบบปกติใน R
คำแนะนำเกี่ยวกับ dnorm, pnorm, qnorm และ rnorm ใน R
วิธีทำการทดสอบ Shapiro-Wilk เพื่อความปกติใน R