Como aplicar a regra prática em r


A regra prática , às vezes chamada de regra 68-95-99,7, afirma que para um determinado conjunto de dados com distribuição normal:

  • 68% dos valores dos dados estão dentro de um desvio padrão da média.
  • 95% dos valores dos dados estão dentro de dois desvios padrão da média.
  • 99,7% dos valores dos dados estão dentro de três desvios padrão da média.

Neste tutorial, explicamos como aplicar a regra prática em R a um determinado conjunto de dados.

Aplicando a regra prática em R

A função pnorm() em R retorna o valor da função de densidade cumulativa da distribuição normal.

Esta função usa a seguinte sintaxe básica:

norma(q, média, sd)

Ouro:

  • q : valor da variável aleatória normalmente distribuída
  • média : distribuição média
  • sd : desvio padrão da distribuição

Podemos usar a seguinte sintaxe para encontrar a área sob a curva de distribuição normal que fica entre vários desvios padrão:

 #find area under normal curve within 1 standard deviation of mean
pnorm(1) - pnorm(-1)

[1] 0.6826895

#find area under normal curve within 2 standard deviations of mean 
pnorm(2) - pnorm(-2)

[1] 0.9544997

#find area under normal curve within 3 standard deviations of mean 
pnorm(3) - pnorm(-3)

[1] 0.9973002

Pelo resultado podemos confirmar:

  • 68% dos valores dos dados estão dentro de um desvio padrão da média.
  • 95% dos valores dos dados estão dentro de dois desvios padrão da média.
  • 99,7% dos valores dos dados estão dentro de três desvios padrão da média.

Os exemplos a seguir mostram como usar a regra prática com diferentes conjuntos de dados na prática.

Exemplo 1: Aplicando a regra empírica a um conjunto de dados em R

Suponha que tenhamos um conjunto de dados normalmente distribuído com média 7 e desvio padrão de 2,2 .

Podemos usar o código a seguir para determinar quais valores contêm 68%, 95% e 99,7% dos dados:

 #define mean and standard deviation values
mean=7
sd=2.2

#find which values contain 68% of data
mean-2.2; mean+2.2

[1] 4.8
[1] 9.2

#find which values contain 95% of data
mean-2*2.2; mean+2*2.2

[1] 2.6
[1] 11.4

#find which values contain 99.7% of data
mean-3*2.2; mean+3*2.2

[1] 0.4
[1] 13.6

A partir desta saída podemos ver:

  • 68% dos dados estão entre 4,8 e 9,2
  • 95% dos dados estão entre 2,6 e 11,4
  • 99,7% dos dados estão entre 0,4 e 13,6

Exemplo 2: Determine qual porcentagem de dados fica entre determinados valores

Imagine que temos um conjunto de dados normalmente distribuído com média 100 e desvio padrão 5.

Suponha que queiramos saber qual porcentagem dos dados está entre os valores 99 e 105 nesta distribuição.

Podemos usar a função pnorm( ) para encontrar a resposta:

 #find area under normal curve between 99 and 105
pnorm(105, mean=100, sd=5) - pnorm(99, mean=100, sd=5)

[1] 0.4206045

Vemos que 42,06% dos dados estão entre os valores 99 e 105 para esta distribuição.

Recursos adicionais

Como aplicar a regra prática no Excel
Problemas na prática de regras práticas
Calculadora de regras práticas

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *