Jak wygenerować rozkład normalny w r (z przykładami)


Możesz szybko wygenerować rozkład normalny w R za pomocą funkcji rnorm() , która wykorzystuje następującą składnię:

 rnorm(n, mean=0, sd=1)

Złoto:

  • n: Liczba obserwacji.
  • średnia: średnia rozkładu normalnego. Wartość domyślna to 0.
  • sd: odchylenie standardowe rozkładu normalnego. Wartość domyślna to 1.

W tym samouczku pokazano przykład użycia tej funkcji do wygenerowania rozkładu normalnego w języku R.

Powiązane: Przewodnik po dnorm, pnorm, qnorm i rnorm w R

Przykład: generowanie rozkładu normalnego w R

Poniższy kod pokazuje, jak wygenerować rozkład normalny w R:

 #make this example reproducible
set.seed(1)

#generate sample of 200 obs. that follows normal dist. with mean=10 and sd=3
data <- rnorm(200, mean=10, sd=3)

#view first 6 observations in sample
head(data)

[1] 8.120639 10.550930 7.493114 14.785842 10.988523 7.538595

Możemy szybko znaleźć średnią i odchylenie standardowe tego rozkładu:

 #find mean of sample
mean(data)

[1] 10.10662

#find standard deviation of sample
sd(data)

[1] 2.787292

Możemy również utworzyć szybki histogram w celu wizualizacji rozkładu wartości danych:

 hist(data, col=' steelblue ')

Wygeneruj rozkład normalny w R

Możemy nawet wykonaćtest Shapiro-Wilka, aby sprawdzić, czy zbiór danych pochodzi z normalnej populacji:

 shapiro.test(data)

	Shapiro-Wilk normality test

data:data
W = 0.99274, p-value = 0.4272

Wartość p testu wynosi 0,4272 . Ponieważ wartość ta jest nie mniejsza niż 0,05, możemy założyć, że przykładowe dane pochodzą z populacji o rozkładzie normalnym.

Wynik ten nie powinien być zaskakujący, ponieważ dane wygenerowaliśmy za pomocą funkcji rnorm() , która w naturalny sposób generuje losową próbkę danych z rozkładu normalnego.

Dodatkowe zasoby

Jak wykreślić rozkład normalny w R
Przewodnik po dnorm, pnorm, qnorm i rnorm w R
Jak wykonać test Shapiro-Wilka na normalność w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *