Come applicare la regola pratica in r


La regola pratica , a volte chiamata regola 68-95-99.7, afferma che per un dato set di dati con una distribuzione normale:

  • Il 68% dei valori dei dati rientra in una deviazione standard dalla media.
  • Il 95% dei valori dei dati si trova entro due deviazioni standard dalla media.
  • Il 99,7% dei valori dei dati rientra nelle tre deviazioni standard della media.

In questo tutorial spieghiamo come applicare la regola pratica in R a un determinato set di dati.

Applicando la regola pratica di R

La funzione pnorm() in R restituisce il valore della funzione di densità cumulativa della distribuzione normale.

Questa funzione utilizza la seguente sintassi di base:

pnorm(q, media, sd)

Oro:

  • q : valore della variabile casuale normalmente distribuita
  • media : distribuzione media
  • sd : deviazione standard della distribuzione

Possiamo usare la seguente sintassi per trovare l’area sotto la curva di distribuzione normale che si trova tra le varie deviazioni standard:

 #find area under normal curve within 1 standard deviation of mean
pnorm(1) - pnorm(-1)

[1] 0.6826895

#find area under normal curve within 2 standard deviations of mean 
pnorm(2) - pnorm(-2)

[1] 0.9544997

#find area under normal curve within 3 standard deviations of mean 
pnorm(3) - pnorm(-3)

[1] 0.9973002

Dal risultato possiamo confermare:

  • Il 68% dei valori dei dati rientra in una deviazione standard dalla media.
  • Il 95% dei valori dei dati si trova entro due deviazioni standard dalla media.
  • Il 99,7% dei valori dei dati rientra nelle tre deviazioni standard della media.

Gli esempi seguenti mostrano come utilizzare nella pratica la regola pratica con diversi set di dati.

Esempio 1: applicazione della regola empirica a un set di dati in R

Supponiamo di avere un set di dati distribuito normalmente con una media di 7 e una deviazione standard di 2,2 .

Possiamo utilizzare il seguente codice per determinare quali valori contengono il 68%, 95% e 99,7% dei dati:

 #define mean and standard deviation values
mean=7
sd=2.2

#find which values contain 68% of data
mean-2.2; mean+2.2

[1] 4.8
[1] 9.2

#find which values contain 95% of data
mean-2*2.2; mean+2*2.2

[1] 2.6
[1] 11.4

#find which values contain 99.7% of data
mean-3*2.2; mean+3*2.2

[1] 0.4
[1] 13.6

Da questo output possiamo vedere:

  • Il 68% dei dati è compreso tra 4,8 e 9,2
  • Il 95% dei dati è compreso tra 2,6 e 11,4
  • Il 99,7% dei dati è compreso tra 0,4 e 13,6

Esempio 2: determinare quale percentuale di dati rientra tra determinati valori

Immaginiamo di avere un set di dati distribuito normalmente con una media di 100 e una deviazione standard di 5.

Supponiamo di voler sapere quale percentuale dei dati rientra tra i valori 99 e 105 in questa distribuzione.

Possiamo usare la funzione pnorm( ) per trovare la risposta:

 #find area under normal curve between 99 and 105
pnorm(105, mean=100, sd=5) - pnorm(99, mean=100, sd=5)

[1] 0.4206045

Vediamo che il 42,06% dei dati rientra tra i valori 99 e 105 per questa distribuzione.

Risorse addizionali

Come applicare la regola pratica in Excel
Problemi nel mettere in pratica le regole pratiche
Calcolatore delle regole del pollice

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *