Liczba zajęć (statystyki)

W tym artykule wyjaśniono, jak znaleźć liczbę klas w statystykach. Dowiesz się również, jak obliczana jest szerokość przedziałów po znalezieniu liczby klas, a ponadto będziesz mógł zobaczyć kilka konkretnych przykładów.

Jak obliczyć liczbę klas w statystyce

Głównie w statystyce istnieją dwie metody obliczania idealnej liczby klas dla próbki danych: reguła Sturgesa, która jest formułą, oraz metoda pierwiastkowa, która polega na znajdowaniu pierwiastka kwadratowego z całkowitej liczby danych.

W zależności od próbki zaleca się zastosowanie tej lub innej metody. Obie metody wyjaśniono poniżej na przykładzie.

Reguła Sturgesa

Reguła Sturgesa to reguła używana do obliczania idealnej liczby klas lub przedziałów, na które należy podzielić zbiór danych. W szczególności wzór Reguły Sturgesa stwierdza, że odpowiednia liczba klas jest równa jeden plus logarytm podstawowy dwa z całkowitej liczby punktów danych.

c=1+\log_2(N)

Złoto

c

to liczba klas lub interwałów i

N

to całkowita liczba obserwacji w próbie.

Większość kalkulatorów umożliwia obliczenia wyłącznie przy użyciu logarytmów o podstawie 10. W takim przypadku możesz użyć równoważnej formuły:

c=1+\cfrac{\log(N)}{\log(2)}

Przykładowo, jeśli mamy próbę statystyczną liczącą 100 obserwacji, zgodnie z regułą Sturgesa liczbę klas, z którymi należy pogrupować dane, oblicza się w następujący sposób:

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(100)\\[2ex]c=1+6,64\\[2ex]c=7,64\\[2ex]c\approx 8\end{array}

Zatem w przypadku próbki zawierającej łącznie 100 punktów danych dane należy podzielić na 8 różnych przedziałów.

metoda korzeniowa

Chociaż reguła Sturgesa jest z pewnością lepiej znana, inną powszechnie stosowaną w statystyce metodą obliczania liczby klas jest obliczenie pierwiastka kwadratowego z wielkości próby.

Zatem inny wzór na obliczenie idealnej liczby klas jest następujący:

c=\sqrt{N}

Złoto

c

to liczba klas lub interwałów i

N

to całkowita liczba elementów danych w próbie.

Na przykład, jeśli mamy w sumie 150 fragmentów danych, obliczenie liczby przedziałów, na które musimy podzielić dane, będzie następujące:

c=\sqrt{150}=12,25 \approx 12

Poprzedni wzór stosuje się, gdy wielkość próby jest mniejsza niż 200, ale gdy mamy 200 lub więcej danych, lepiej obliczyć liczbę klas, biorąc pierwiastek sześcienny:

c=\sqrt[3]{N}

Złoto

c

to liczba klas lub interwałów i

N

to całkowita liczba elementów danych w próbie.

Liczba klas i szerokość interwału

Po obliczeniu liczby przedziałów możemy obliczyć szerokość każdego przedziału, korzystając z następującego wzoru:

 \text{Amplitud de intervalo}=\cfrac{\text{Rango}}{\text{N\'umero de clases}}

Poniżej rozwiązano przykładowe ćwiczenie, dzięki któremu można zobaczyć, jak obliczana jest szerokość interwałów.

  • Zarejestrowano następujące dane statystyczne. Oblicz liczbę klas za pomocą reguły Sturgesa, a następnie określ szerokość każdego przedziału.

35\ 18\ 25\ 2\ 45\ 34\ 68\ 42\ 9\ 41\ 62\ 85\ 53

21\ 4\ 86\ 50\ 32\ 71\ 59\ 29\ 12\ 38\ 91\ 63\ 7

67\ 37\ 23\ 70\ 65\ 47\ 76\ 83\ 54\ 27\ 25\ 19\ 98

Jak widzieliśmy powyżej, aby określić liczbę klas, w jakie należy pogrupować dane, stosujemy regułę Sturgesa. W tym przypadku mamy 39 danych, dlatego we wzorze musimy zastąpić parametr N liczbą 39:

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(39)\\[2ex]c=1+5,28\\[2ex]c=6,28\\[2ex]c\approx 6\end{array}

Teraz, gdy znamy już odpowiednią liczbę klas, obliczmy szerokość każdej klasy. Aby to zrobić, musimy najpierw obliczyć zakres przykładowych danych:

R=98-2=96

A gdy już znamy liczebność próby, otrzymaną wartość dzielimy przez obliczoną wcześniej liczbę klas (6):

\text{Amplitud de intervalo}=\cfrac{96}{6}=16

Szerokość wszystkich klas musi zatem wynosić 16 jednostek. Dlatego klasy, które moglibyśmy osiągnąć, to:

\begin{array}{l}[2,18)\\[2ex][18,34)\\[2ex][34,50)\\[2ex][50,66)\\[2ex][66,82)\\[2ex][82,98]\end{array}

Liczba klas w rozkładzie częstotliwości

Na koniec należy zauważyć, że obliczenie liczby klas jest ważne podczas tworzenia rozkładu częstotliwości (lub tabeli częstości), w ten sposób można szybko podzielić dane na różne przedziały, a następnie znaleźć wszystkie typy częstości każdego przedziału. .

Jeśli nie wiesz, co to jest, rozkład częstotliwości to tabela, która zawiera listę wszystkich typów częstotliwości dla każdego przedziału. Zatem każdy wiersz to inna klasa, a każda kolumna ma inny typ częstotliwości.

Aby zobaczyć przykład rozkładu częstotliwości z pogrupowanymi danymi, kliknij poniższy link:

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *