Jak oszacować odchylenie standardowe dowolnego histogramu


Histogram zapewnia użyteczny sposób wizualizacji rozkładu wartości w zbiorze danych.

Oś x histogramu przedstawia grupy wartości danych, a oś y informuje nas, ile obserwacji w zbiorze danych znajduje się w każdej grupie.

Histogram Średni

Ponieważ histogram umieszcza obserwacje w pojemnikach, nie jest możliwe obliczenie dokładnego odchylenia standardowego zbioru danych reprezentowanego przez histogram, ale możliwe jest oszacowanie odchylenia standardowego.

Poniższy przykład pokazuje, jak to zrobić.

Powiązane: Jak oszacować średnią i medianę dowolnego histogramu

Jak oszacować odchylenie standardowe histogramu

Aby oszacować odchylenie standardowe histogramu, należy najpierw oszacować średnią.

Aby oszacować średnią, możemy skorzystać z następującego wzoru:

Średnia: Σm i n i / N

Złoto:

  • m i : Środek i -tego pojemnika
  • n i : Częstotliwość i- tego przedziału
  • N: Całkowity rozmiar próbki

Załóżmy na przykład, że mamy następujący histogram:

Średni histogram

Oto jak oszacować średnią wartość tego histogramu:

Wzór na uśrednianie pogrupowanych danych

Średnią szacujemy na 22,89 .

Uwaga: Środek każdej grupy można znaleźć, biorąc średnią z dolnej i górnej wartości zakresu. Na przykład punkt środkowy pierwszej grupy oblicza się w następujący sposób: (1+10) / 2 = 5,5.

Teraz, gdy mamy już oszacowanie średniej, możemy użyć następującego wzoru do oszacowania odchylenia standardowego:

Odchylenie standardowe:Σn i (m i -μ) 2 / (N-1)

Złoto:

  • n i : Częstotliwość i- tego przedziału
  • m i : Środek i -tego pojemnika
  • µ : Średnia
  • N: Całkowity rozmiar próbki

Oto jak zastosowalibyśmy tę formułę do naszego zbioru danych:

Oszacuj odchylenie standardowe histogramu Szacujemy, że odchylenie standardowe zbioru danych wynosi 9,6377 .

Chociaż nie ma gwarancji, że będzie dokładnie odpowiadać odchyleniu standardowemu zbioru danych (ponieważ nie znamy wartości surowych danych zbioru danych), stanowi to nasze najlepsze oszacowanie odchylenia standardowego.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania związane z danymi pogrupowanymi w grupy:

Jak znaleźć wariancję pogrupowanych danych
Jak znaleźć medianę pogrupowanych danych
Jak znaleźć tryb pogrupowanych danych

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *