Jak oszacować odchylenie standardowe dowolnego histogramu
Histogram zapewnia użyteczny sposób wizualizacji rozkładu wartości w zbiorze danych.
Oś x histogramu przedstawia grupy wartości danych, a oś y informuje nas, ile obserwacji w zbiorze danych znajduje się w każdej grupie.
Ponieważ histogram umieszcza obserwacje w pojemnikach, nie jest możliwe obliczenie dokładnego odchylenia standardowego zbioru danych reprezentowanego przez histogram, ale możliwe jest oszacowanie odchylenia standardowego.
Poniższy przykład pokazuje, jak to zrobić.
Powiązane: Jak oszacować średnią i medianę dowolnego histogramu
Jak oszacować odchylenie standardowe histogramu
Aby oszacować odchylenie standardowe histogramu, należy najpierw oszacować średnią.
Aby oszacować średnią, możemy skorzystać z następującego wzoru:
Średnia: Σm i n i / N
Złoto:
- m i : Środek i -tego pojemnika
- n i : Częstotliwość i- tego przedziału
- N: Całkowity rozmiar próbki
Załóżmy na przykład, że mamy następujący histogram:
Oto jak oszacować średnią wartość tego histogramu:
Średnią szacujemy na 22,89 .
Uwaga: Środek każdej grupy można znaleźć, biorąc średnią z dolnej i górnej wartości zakresu. Na przykład punkt środkowy pierwszej grupy oblicza się w następujący sposób: (1+10) / 2 = 5,5.
Teraz, gdy mamy już oszacowanie średniej, możemy użyć następującego wzoru do oszacowania odchylenia standardowego:
Odchylenie standardowe: √ Σn i (m i -μ) 2 / (N-1)
Złoto:
- n i : Częstotliwość i- tego przedziału
- m i : Środek i -tego pojemnika
- µ : Średnia
- N: Całkowity rozmiar próbki
Oto jak zastosowalibyśmy tę formułę do naszego zbioru danych:
Szacujemy, że odchylenie standardowe zbioru danych wynosi 9,6377 .
Chociaż nie ma gwarancji, że będzie dokładnie odpowiadać odchyleniu standardowemu zbioru danych (ponieważ nie znamy wartości surowych danych zbioru danych), stanowi to nasze najlepsze oszacowanie odchylenia standardowego.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania związane z danymi pogrupowanymi w grupy:
Jak znaleźć wariancję pogrupowanych danych
Jak znaleźć medianę pogrupowanych danych
Jak znaleźć tryb pogrupowanych danych