Como traçar uma distribuição normal em r
Para traçar uma distribuição normal em R, podemos usar a base R ou instalar um pacote mais sofisticado como ggplot2.
UsandoBaseR
Aqui estão três exemplos de criação de um gráfico de distribuição normal usando Base R.
Exemplo 1: distribuição normal com média = 0 e desvio padrão = 1
Para criar um gráfico de distribuição normal com média = 0 e desvio padrão = 1, podemos usar o seguinte código:
#Create a sequence of 100 equally spaced numbers between -4 and 4 x <- seq(-4, 4, length=100) #create a vector of values that shows the height of the probability distribution #for each value in x y <- dnorm(x) #plot x and y as a scatterplot with connected lines (type = "l") and add #an x-axis with custom labels plot(x,y, type = "l", lwd = 2, axes = FALSE, xlab = "", ylab = "") axis(1, at = -3:3, labels = c("-3s", "-2s", "-1s", "mean", "1s", "2s", "3s"))
Isso gera o seguinte gráfico:
Exemplo 2: Distribuição normal com média = 0 e desvio padrão = 1 (menos código)
Também poderíamos criar um gráfico de distribuição normal sem definir x e y e simplesmente usando a função “curva” usando o seguinte código:
curve(dnorm, -3.5, 3.5, lwd=2, axes = FALSE, xlab = "", ylab = "") axis(1, at = -3:3, labels = c("-3s", "-2s", "-1s", "mean", "1s", "2s", "3s"))
Isso gera exatamente o mesmo gráfico:
Exemplo 3: Distribuição Normal com Média Personalizada e Desvio Padrão
Para criar um gráfico de distribuição normal com média e desvio padrão definidos pelo usuário, podemos usar o seguinte código:
#define population mean and standard deviation population_mean <- 50 population_sd <- 5 #define upper and lower bound lower_bound <- population_mean - population_sd upper_bound <- population_mean + population_sd #Create a sequence of 1000 x values based on population mean and standard deviation x <- seq(-4, 4, length = 1000) * population_sd + population_mean #create a vector of values that shows the height of the probability distribution #for each value in x y <- dnorm(x, population_mean, population_sd) #plot normal distribution with customized x-axis labels plot(x,y, type = "l", lwd = 2, axes = FALSE, xlab = "", ylab = "") sd_axis_bounds = 5 axis_bounds <- seq(-sd_axis_bounds * population_sd + population_mean, sd_axis_bounds * population_sd + population_mean, by = population_sd) axis(side = 1, at = axis_bounds, pos = 0)
Isso gera o seguinte gráfico:
Usando ggplot2
Outra maneira de criar um gráfico de distribuição normal em R é usar o pacote ggplot2. Aqui estão dois exemplos de criação de um gráfico de distribuição normal usando ggplot2.
Exemplo 1: distribuição normal com média = 0 e desvio padrão = 1
Para criar um gráfico de distribuição normal com média = 0 e desvio padrão = 1, podemos usar o seguinte código:
#install (if not already installed) and load ggplot2 if(!(require(ggplot2))){install.packages('ggplot2')} #generate a normal distribution plot ggplot(data.frame(x = c(-4, 4)), aes(x = x)) + stat_function(fun = dnorm)
Isso gera o seguinte gráfico:
Exemplo 2: distribuição normal usando conjunto de dados ‘mtcars’
O código a seguir demonstra como criar uma distribuição normal para a coluna de milhas por galão no conjunto de dados R incorporado mtcars :
ggplot(mtcars, aes(x = mpg)) + stat_function( fun = dnorm, args = with(mtcars, c(mean = mean(mpg), sd = sd(mpg))) ) + scale_x_continuous("Miles per gallon")
Isso gera o seguinte gráfico: