Come stimare la media e la mediana di qualsiasi istogramma
Un istogramma è un grafico che ci aiuta a visualizzare la distribuzione dei valori in un insieme di dati.
L’asse x di un istogramma mostra gruppi di valori di dati e l’asse y ci dice quante osservazioni in un set di dati sono presenti in ciascun gruppo.
Sebbene gli istogrammi siano utili per visualizzare le distribuzioni, non è sempre ovvio conoscere i valori medi e mediani semplicemente guardando gli istogrammi.
E sebbene non sia possibile trovare i valori medi e mediani esatti di una distribuzione semplicemente osservando un istogramma, è possibile stimare entrambi i valori. Questo tutorial spiega come farlo.
Come stimare la media di un istogramma
Possiamo utilizzare la seguente formula per trovare la migliore stima della media di qualsiasi istogramma:
Migliore stima della media: Σm i n i / N
Oro:
- m i : La metà dell’iesimo contenitore
- n i : La frequenza dell’i- esimo bin
- N: la dimensione totale del campione
Consideriamo ad esempio il seguente istogramma:
La nostra migliore stima della media sarebbe:
Media = (5,5*2 + 15,5*7 + 25,5*10 + 35,5*3 + 45,5*1) / 23 = 22,89 .
Osservando l’istogramma, questa sembra essere una stima ragionevole della media.
Come stimare la mediana di un istogramma
Possiamo utilizzare la seguente formula per trovare la migliore stima della mediana di qualsiasi istogramma:
Migliore stima della mediana: L + ((n/2 – F) / f) * w
Oro:
- L: Il limite inferiore del gruppo centrale
- n: il numero totale di osservazioni
- F: La frequenza cumulativa fino al gruppo centrale
- f: La frequenza del gruppo centrale
- w: La larghezza del gruppo centrale
Ancora una volta, considera il seguente istogramma:
La nostra migliore stima della mediana sarebbe:
Mediana = 21 + ((25/2 – 9) / 10) * 9 = 24,15 .
Osservando l’istogramma, anche questa sembra essere una stima ragionevole della mediana.
Correlato: Come stimare la deviazione standard di qualsiasi istogramma
Risorse addizionali
Come trovare la media, la mediana e la moda nei grafici di fusti e foglie
Come calcolare la media dalle tabelle di frequenza
Quando utilizzare la media rispetto alla mediana