Come applicare la regola pratica in r
La regola pratica , a volte chiamata regola 68-95-99.7, afferma che per un dato set di dati con una distribuzione normale:
- Il 68% dei valori dei dati rientra in una deviazione standard dalla media.
- Il 95% dei valori dei dati si trova entro due deviazioni standard dalla media.
- Il 99,7% dei valori dei dati rientra nelle tre deviazioni standard della media.
In questo tutorial spieghiamo come applicare la regola pratica in R a un determinato set di dati.
Applicando la regola pratica di R
La funzione pnorm() in R restituisce il valore della funzione di densità cumulativa della distribuzione normale.
Questa funzione utilizza la seguente sintassi di base:
pnorm(q, media, sd)
Oro:
- q : valore della variabile casuale normalmente distribuita
- media : distribuzione media
- sd : deviazione standard della distribuzione
Possiamo usare la seguente sintassi per trovare l’area sotto la curva di distribuzione normale che si trova tra le varie deviazioni standard:
#find area under normal curve within 1 standard deviation of mean pnorm(1) - pnorm(-1) [1] 0.6826895 #find area under normal curve within 2 standard deviations of mean pnorm(2) - pnorm(-2) [1] 0.9544997 #find area under normal curve within 3 standard deviations of mean pnorm(3) - pnorm(-3) [1] 0.9973002
Dal risultato possiamo confermare:
- Il 68% dei valori dei dati rientra in una deviazione standard dalla media.
- Il 95% dei valori dei dati si trova entro due deviazioni standard dalla media.
- Il 99,7% dei valori dei dati rientra nelle tre deviazioni standard della media.
Gli esempi seguenti mostrano come utilizzare nella pratica la regola pratica con diversi set di dati.
Esempio 1: applicazione della regola empirica a un set di dati in R
Supponiamo di avere un set di dati distribuito normalmente con una media di 7 e una deviazione standard di 2,2 .
Possiamo utilizzare il seguente codice per determinare quali valori contengono il 68%, 95% e 99,7% dei dati:
#define mean and standard deviation values mean=7 sd=2.2 #find which values contain 68% of data mean-2.2; mean+2.2 [1] 4.8 [1] 9.2 #find which values contain 95% of data mean-2*2.2; mean+2*2.2 [1] 2.6 [1] 11.4 #find which values contain 99.7% of data mean-3*2.2; mean+3*2.2 [1] 0.4 [1] 13.6
Da questo output possiamo vedere:
- Il 68% dei dati è compreso tra 4,8 e 9,2
- Il 95% dei dati è compreso tra 2,6 e 11,4
- Il 99,7% dei dati è compreso tra 0,4 e 13,6
Esempio 2: determinare quale percentuale di dati rientra tra determinati valori
Immaginiamo di avere un set di dati distribuito normalmente con una media di 100 e una deviazione standard di 5.
Supponiamo di voler sapere quale percentuale dei dati rientra tra i valori 99 e 105 in questa distribuzione.
Possiamo usare la funzione pnorm( ) per trovare la risposta:
#find area under normal curve between 99 and 105
pnorm(105, mean=100, sd=5) - pnorm(99, mean=100, sd=5)
[1] 0.4206045
Vediamo che il 42,06% dei dati rientra tra i valori 99 e 105 per questa distribuzione.
Risorse addizionali
Come applicare la regola pratica in Excel
Problemi nel mettere in pratica le regole pratiche
Calcolatore delle regole del pollice