Come stimare la deviazione standard di qualsiasi istogramma
Un istogramma fornisce un modo utile per visualizzare la distribuzione dei valori in un set di dati.
L’asse x di un istogramma mostra gruppi di valori di dati e l’asse y ci dice quante osservazioni in un set di dati sono presenti in ciascun gruppo.
Poiché un istogramma colloca le osservazioni in contenitori, non è possibile calcolare l’esatta deviazione standard del set di dati rappresentato dall’istogramma, ma è possibile stimare la deviazione standard.
L’esempio seguente mostra come eseguire questa operazione.
Correlato: Come stimare la media e la mediana di qualsiasi istogramma
Come stimare la deviazione standard di un istogramma
Per stimare la deviazione standard di un istogramma, devi prima stimare la media.
Possiamo utilizzare la seguente formula per stimare la media:
Media: Σm i n i / N
Oro:
- m i : La metà dell’iesimo contenitore
- n i : La frequenza dell’i- esimo bin
- N: la dimensione totale del campione
Ad esempio, supponiamo di avere il seguente istogramma:
Ecco come stimare il valore medio di questo istogramma:
Stimiamo la media a 22,89 .
Nota: il punto medio di ciascun gruppo può essere trovato prendendo la media dei valori inferiore e superiore dell’intervallo. Ad esempio, il punto medio del primo gruppo viene calcolato come segue: (1+10) / 2 = 5,5.
Ora che abbiamo una stima della media, possiamo utilizzare la seguente formula per stimare la deviazione standard:
Deviazione standard: √ Σn i (m i -μ) 2 / (N-1)
Oro:
- n i : La frequenza dell’i- esimo bin
- m i : La metà dell’iesimo contenitore
- μ : La media
- N: la dimensione totale del campione
Ecco come applicheremmo questa formula al nostro set di dati:
Stimiamo che la deviazione standard del set di dati sia 9.6377 .
Sebbene non sia garantito che corrisponda esattamente alla deviazione standard del set di dati (poiché non conosciamo i valori dei dati grezzi del set di dati), rappresenta la nostra migliore stima della deviazione standard.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni relative ai dati raggruppati in gruppi:
Come trovare la varianza dei dati raggruppati
Come trovare la mediana dei dati raggruppati
Come trovare la modalità dati raggruppati