Como aplicar a regra prática em r
A regra prática , às vezes chamada de regra 68-95-99,7, afirma que para um determinado conjunto de dados com distribuição normal:
- 68% dos valores dos dados estão dentro de um desvio padrão da média.
- 95% dos valores dos dados estão dentro de dois desvios padrão da média.
- 99,7% dos valores dos dados estão dentro de três desvios padrão da média.
Neste tutorial, explicamos como aplicar a regra prática em R a um determinado conjunto de dados.
Aplicando a regra prática em R
A função pnorm() em R retorna o valor da função de densidade cumulativa da distribuição normal.
Esta função usa a seguinte sintaxe básica:
norma(q, média, sd)
Ouro:
- q : valor da variável aleatória normalmente distribuída
- média : distribuição média
- sd : desvio padrão da distribuição
Podemos usar a seguinte sintaxe para encontrar a área sob a curva de distribuição normal que fica entre vários desvios padrão:
#find area under normal curve within 1 standard deviation of mean pnorm(1) - pnorm(-1) [1] 0.6826895 #find area under normal curve within 2 standard deviations of mean pnorm(2) - pnorm(-2) [1] 0.9544997 #find area under normal curve within 3 standard deviations of mean pnorm(3) - pnorm(-3) [1] 0.9973002
Pelo resultado podemos confirmar:
- 68% dos valores dos dados estão dentro de um desvio padrão da média.
- 95% dos valores dos dados estão dentro de dois desvios padrão da média.
- 99,7% dos valores dos dados estão dentro de três desvios padrão da média.
Os exemplos a seguir mostram como usar a regra prática com diferentes conjuntos de dados na prática.
Exemplo 1: Aplicando a regra empírica a um conjunto de dados em R
Suponha que tenhamos um conjunto de dados normalmente distribuído com média 7 e desvio padrão de 2,2 .
Podemos usar o código a seguir para determinar quais valores contêm 68%, 95% e 99,7% dos dados:
#define mean and standard deviation values mean=7 sd=2.2 #find which values contain 68% of data mean-2.2; mean+2.2 [1] 4.8 [1] 9.2 #find which values contain 95% of data mean-2*2.2; mean+2*2.2 [1] 2.6 [1] 11.4 #find which values contain 99.7% of data mean-3*2.2; mean+3*2.2 [1] 0.4 [1] 13.6
A partir desta saída podemos ver:
- 68% dos dados estão entre 4,8 e 9,2
- 95% dos dados estão entre 2,6 e 11,4
- 99,7% dos dados estão entre 0,4 e 13,6
Exemplo 2: Determine qual porcentagem de dados fica entre determinados valores
Imagine que temos um conjunto de dados normalmente distribuído com média 100 e desvio padrão 5.
Suponha que queiramos saber qual porcentagem dos dados está entre os valores 99 e 105 nesta distribuição.
Podemos usar a função pnorm( ) para encontrar a resposta:
#find area under normal curve between 99 and 105
pnorm(105, mean=100, sd=5) - pnorm(99, mean=100, sd=5)
[1] 0.4206045
Vemos que 42,06% dos dados estão entre os valores 99 e 105 para esta distribuição.
Recursos adicionais
Como aplicar a regra prática no Excel
Problemas na prática de regras práticas
Calculadora de regras práticas