Aantal klassen (statistieken)

In dit artikel wordt uitgelegd hoe u het aantal klassen in statistieken kunt vinden. Ook zul je na het vinden van het aantal klassen ontdekken hoe de breedte van de intervallen wordt berekend en daarnaast kun je verschillende concrete voorbeelden zien.

Hoe het aantal klassen in statistieken te berekenen

In de statistiek zijn er voornamelijk twee methoden om het ideale aantal klassen voor een gegevensmonster te berekenen : de regel van Sturges, die een formule is, en de wortelmethode, waarbij de vierkantswortel van het totale aantal gegevens wordt gevonden.

Afhankelijk van het monster is het raadzaam om de ene of de andere methode te gebruiken. Beide methoden worden hieronder uitgelegd met een voorbeeld.

De regel van Sturges

De regel van Sturges is een regel die wordt gebruikt om het ideale aantal klassen of intervallen te berekenen waarin een dataset moet worden verdeeld. Concreet stelt de formule van de Sturges-regel dat het juiste aantal klassen gelijk is aan één plus de logaritme met grondtal twee van het totale aantal datapunten.

c=1+\log_2(N)

Goud

c

is het aantal klassen of intervallen en

N

is het totale aantal waarnemingen in de steekproef.

De meeste rekenmachines staan alleen berekeningen toe met logaritmes met grondtal 10. In dit geval kunt u deze equivalente formule gebruiken:

c=1+\cfrac{\log(N)}{\log(2)}

Als we bijvoorbeeld een statistische steekproef van 100 waarnemingen hebben, wordt volgens de regel van Sturges het aantal klassen waarmee de gegevens moeten worden gegroepeerd als volgt berekend:

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(100)\\[2ex]c=1+6,64\\[2ex]c=7,64\\[2ex]c\approx 8\end{array}

Voor een steekproef met in totaal 100 gegevenspunten moeten de gegevens dus in 8 verschillende intervallen worden verdeeld.

wortel methode

Hoewel de regel van Sturges ongetwijfeld beter bekend is, is een andere methode die in de statistiek veel wordt gebruikt om het aantal klassen te berekenen, het berekenen van de vierkantswortel van de steekproefomvang.

Een andere formule om het ideale aantal klassen te berekenen is dus als volgt:

c=\sqrt{N}

Goud

c

is het aantal klassen of intervallen en

N

is het totale aantal gegevensitems in de steekproef.

Als we bijvoorbeeld in totaal 150 gegevenseenheden hebben, zou de berekening van het aantal intervallen waarin we de gegevens moeten verdelen als volgt zijn:

c=\sqrt{150}=12,25 \approx 12

De vorige formule wordt gebruikt als de steekproefomvang kleiner is dan 200, maar als we 200 of meer gegevens hebben, is het beter om het aantal klassen te berekenen door de derdemachtswortel te nemen:

c=\sqrt[3]{N}

Goud

c

is het aantal klassen of intervallen en

N

is het totale aantal gegevensitems in de steekproef.

Aantal klassen en intervalbreedte

Nadat we het aantal bakken hebben berekend, kunnen we berekenen hoe breed elk interval moet zijn met behulp van de volgende formule:

 \text{Amplitud de intervalo}=\cfrac{\text{Rango}}{\text{N\'umero de clases}}

Als voorbeeld is hieronder een oefening opgelost zodat je kunt zien hoe de breedte van intervallen wordt berekend.

  • De volgende statistische gegevens werden geregistreerd. Bereken het aantal klassen met de regel van Sturges en bepaal vervolgens de breedte van elk interval.

35\ 18\ 25\ 2\ 45\ 34\ 68\ 42\ 9\ 41\ 62\ 85\ 53

21\ 4\ 86\ 50\ 32\ 71\ 59\ 29\ 12\ 38\ 91\ 63\ 7

67\ 37\ 23\ 70\ 65\ 47\ 76\ 83\ 54\ 27\ 25\ 19\ 98

Zoals we hierboven hebben gezien, passen we de regel van Sturges toe om te bepalen in hoeveel klassen de gegevens moeten worden gegroepeerd. In dit geval hebben we 39 gegevens, dus in de formule moeten we de parameter N vervangen door 39:

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(39)\\[2ex]c=1+5,28\\[2ex]c=6,28\\[2ex]c\approx 6\end{array}

Nu we het juiste aantal klassen kennen, gaan we de breedte van elke klasse berekenen. Om dit te doen, moeten we eerst het bereik van de voorbeeldgegevens berekenen:

R=98-2=96

En zodra we de omvang van de steekproef kennen, delen we de gevonden waarde door het aantal eerder berekende klassen (6):

\text{Amplitud de intervalo}=\cfrac{96}{6}=16

De breedte van alle klassen moet daarom 16 eenheden zijn. Daarom zijn de klassen die we kunnen bereiken:

\begin{array}{l}[2,18)\\[2ex][18,34)\\[2ex][34,50)\\[2ex][50,66)\\[2ex][66,82)\\[2ex][82,98]\end{array}

Aantal klassen in een frequentieverdeling

Ten slotte moet worden opgemerkt dat het berekenen van het aantal klassen belangrijk is bij het maken van een frequentieverdeling (of frequentietabel). Op deze manier kunt u de gegevens snel in verschillende intervallen verdelen en vervolgens alle soorten frequenties van elk interval vinden. .

Voor het geval u niet weet wat het is: een frequentieverdeling is een tabel waarin alle frequentietypen voor elk interval worden vermeld. Elke rij is dus een andere klasse en elke kolom heeft een ander frequentietype.

Als u een voorbeeld wilt zien van een frequentieverdeling met gegroepeerde gegevens, klikt u op de volgende link:

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert