Przewodnik po dnorm, pnorm, qnorm i rnorm w r
Rozkład normalny jest najczęściej używanym rozkładem w statystyce. W tym samouczku wyjaśniono, jak używać rozkładu normalnego w języku R przy użyciu funkcji dnorm , pnorm , rnorm i qnorm .
okropne
Funkcja dnorm zwraca wartość funkcji gęstości prawdopodobieństwa (pdf) rozkładu normalnego, biorąc pod uwagę pewną zmienną losową x , średnią populacji μ i odchylenie standardowe populacji σ . Składnia używania dnorm jest następująca:
dnorm(x, średnia, sd)
Poniższy kod demonstruje kilka przykładów dnorm w akcji:
#find the value of the standard normal distribution pdf at x=0 dnorm(x=0, mean=0, sd=1) #[1]0.3989423 #by default, R uses mean=0 and sd=1 dnorm(x=0) #[1]0.3989423 #find the value of the normal distribution pdf at x=10 with mean=20 and sd=5 dnorm(x=10, mean=20, sd=5) #[1]0.01079819
Zazwyczaj, próbując rozwiązać pytania dotyczące prawdopodobieństwa przy użyciu rozkładu normalnego, często używasz pnorm zamiast dnorm . Przydatnym zastosowaniem dnorm jest jednak utworzenie wykresu rozkładu normalnego w R. Poniższy kod ilustruje, jak to zrobić:
#Create a sequence of 100 equally spaced numbers between -4 and 4 x <- seq(-4, 4, length=100) #create a vector of values that shows the height of the probability distribution #for each value in x y <- dnorm(x) #plot x and y as a scatterplot with connected lines (type = "l") and add #an x-axis with custom labels plot(x,y, type = "l", lwd = 2, axes = FALSE, xlab = "", ylab = "") axis(1, at = -3:3, labels = c("-3s", "-2s", "-1s", "mean", "1s", "2s", "3s"))
Generuje to następujący wykres:
norma
Funkcja pnorm zwraca wartość funkcji gęstości skumulowanej (cdf) rozkładu normalnego, biorąc pod uwagę pewną zmienną losową q , średnią populacji μ i odchylenie standardowe populacji σ . Składnia używania pnorm jest następująca:
pnorm(q, średnia, sd)
Mówiąc najprościej, pnorm zwraca obszar na lewo od danej wartości x w rozkładzie normalnym. Jeśli interesuje Cię obszar na prawo od danej wartości q , możesz po prostu dodać argument less.tail = FALSE
pnorm(q, średnia, sd, niższa.ogon = FAŁSZ)
Poniższe przykłady ilustrują, jak rozwiązać niektóre pytania dotyczące prawdopodobieństwa za pomocą pnorm.
Przykład 1: Załóżmy, że wzrost mężczyzn w pewnej szkole ma rozkład normalny ze średnią odchyleniem standardowym
#find percentage of males that are taller than 74 inches in a population with #mean = 70 and sd = 2 pnorm(74, mean=70, sd=2, lower.tail=FALSE) # [1]0.02275013
W tej szkole 2275% mężczyzn ma ponad 74 cale wzrostu.
Przykład 2: Załóżmy, że masa pewnego gatunku wydry ma rozkład normalny ze średnią odchyleniem standardowym
#find percentage of otters that weight less than 22 lbs in a population with #mean = 30 and sd = 5 pnorm(22, mean=30, sd=5) # [1]0.05479929
Około 5,4799% tego gatunku wydry waży mniej niż 22 funty.
Przykład 3: Załóżmy, że wysokość roślin w pewnym regionie ma rozkład normalny ze średnią odchyleniem standardowym
#find percentage of plants that are less than 14 inches tall, then subtract the #percentage of plants that are less than 10 inches tall, based on a population #with mean = 13 and sd = 2 pnorm(14, mean=13, sd=2) - pnorm(10, mean=13, sd=2) # [1]0.6246553
Około 62,4655% roślin w tym regionie ma wysokość od 10 do 14 cali.
qnorma
Funkcja qnorm zwraca wartość odwrotnej funkcji gęstości skumulowanej (cdf) rozkładu normalnego, biorąc pod uwagę pewną zmienną losową p , średnią populacji μ i odchylenie standardowe populacji σ . Składnia użycia qnorm jest następująca:
qnorm (p, średnia, sd)
Mówiąc prościej, możesz użyć qnorm , aby dowiedzieć się, jaki jest wynik Z p-tego kwantyla rozkładu normalnego.
Poniższy kod demonstruje kilka przykładów qnorm w akcji:
#find the Z-score of the 99th quantile of the standard normal distribution qnorm(.99, mean=0, sd=1) #[1]2.326348 #by default, R uses mean=0 and sd=1 qnorm(.99) #[1]2.326348 #find the Z-score of the 95th quantile of the standard normal distribution qnorm(.95) #[1]1.644854 #find the Z-score of the 10th quantile of the standard normal distribution qnorm(.10) #[1]-1.281552
rnorm
Funkcja rnorm generuje wektor zmiennych losowych o rozkładzie normalnym, mając długość wektora n , średnią populacji μ i odchylenie standardowe populacji σ . Składnia używania rnorm jest następująca:
rnorm(n, średnia, sd)
Poniższy kod demonstruje kilka przykładów rnorm w akcji:
#generate a vector of 5 normally distributed random variables with mean=10 and sd=2 five <- rnorm(5, mean = 10, sd = 2) five # [1] 10.658117 8.613495 10.561760 11.123492 10.802768 #generate a vector of 1000 normally distributed random variables with mean=50 and sd=5 narrowDistribution <- rnorm(1000, mean = 50, sd = 15) #generate a vector of 1000 normally distributed random variables with mean=50 and sd=25 wideDistribution <- rnorm(1000, mean = 50, sd = 25) #generate two histograms to view these two distributions side by side, specify #50 bars in histogram and x-axis limits of -50 to 150 par(mfrow=c(1, 2)) #one row, two columns hist(narrowDistribution, breaks=50, xlim=c(-50, 150)) hist(wideDistribution, breaks=50, xlim=c(-50, 150))
Generuje to następujące histogramy:
Zwróć uwagę, że szeroka dystrybucja jest znacznie szersza niż wąska dystrybucja. Rzeczywiście określiliśmy, że odchylenie standardowe w szerokim rozkładzie wynosiło 25, w porównaniu z zaledwie 15 w wąskim rozkładzie. Należy również zauważyć, że oba histogramy są wyśrodkowane wokół średniej 50.