Как создать нормальное распределение в r (с примерами)
Вы можете быстро сгенерировать нормальное распределение в R, используя функцию rnorm() , которая использует следующий синтаксис:
rnorm(n, mean=0, sd=1)
Золото:
- n: Количество наблюдений.
- среднее значение: среднее нормального распределения. Значение по умолчанию — 0.
- sd: стандартное отклонение нормального распределения. Значение по умолчанию — 1.
В этом руководстве показан пример использования этой функции для создания нормального распределения в R.
Связанный: Руководство по dnorm, pnorm, qnorm и rnorm в R.
Пример: создание нормального распределения в R
Следующий код показывает, как создать нормальное распределение в R:
#make this example reproducible set.seed(1) #generate sample of 200 obs. that follows normal dist. with mean=10 and sd=3 data <- rnorm(200, mean=10, sd=3) #view first 6 observations in sample head(data) [1] 8.120639 10.550930 7.493114 14.785842 10.988523 7.538595
Мы можем быстро найти среднее и стандартное отклонение этого распределения:
#find mean of sample
mean(data)
[1] 10.10662
#find standard deviation of sample
sd(data)
[1] 2.787292
Мы также можем создать быструю гистограмму для визуализации распределения значений данных:
hist(data, col=' steelblue ')
Мы даже можем выполнить тест Шапиро-Уилка, чтобы проверить, получен ли набор данных из нормальной популяции:
shapiro.test(data)
Shapiro-Wilk normality test
data:data
W = 0.99274, p-value = 0.4272
P-значение теста оказалось равным 0,4272 . Поскольку это значение не меньше 0,05, можно предположить, что данные выборки взяты из нормально распределенной совокупности.
Этот результат не должен вызывать удивления, поскольку мы сгенерировали данные с помощью функции rnorm() , которая естественным образом генерирует случайную выборку данных из нормального распределения.
Дополнительные ресурсы
Как построить нормальное распределение в R
Руководство по dnorm, pnorm, qnorm и rnorm в R
Как выполнить тест Шапиро-Уилка на нормальность в R