Anzahl der klassen (statistik)
In diesem Artikel wird erläutert, wie Sie die Anzahl der Klassen in der Statistik ermitteln. Außerdem erfahren Sie, wie die Breite der Intervalle nach Ermittlung der Klassenanzahl berechnet wird und können sich darüber hinaus einige konkrete Beispiele ansehen.
So berechnen Sie die Anzahl der Klassen in der Statistik
In der Statistik gibt es hauptsächlich zwei Methoden zur Berechnung der idealen Anzahl von Klassen für eine Datenstichprobe: die Sturges-Regel, eine Formel, und die Wurzelmethode, bei der die Quadratwurzel der Gesamtzahl der Daten ermittelt wird.
Je nach Probe empfiehlt es sich, die eine oder andere Methode anzuwenden. Beide Methoden werden im Folgenden anhand eines Beispiels erläutert.
Sturges-Regel
Die Sturges-Regel ist eine Regel zur Berechnung der idealen Anzahl von Klassen oder Intervallen, in die ein Datensatz unterteilt werden sollte. Konkret besagt die Formel der Sturges-Regel, dass die entsprechende Anzahl von Klassen gleich eins plus dem Logarithmus zur Basis zwei der Gesamtzahl der Datenpunkte ist.
Gold
ist die Anzahl der Klassen oder Intervalle und
ist die Gesamtzahl der Beobachtungen in der Stichprobe.
Die meisten Rechner erlauben nur Berechnungen mit Logarithmen zur Basis 10. In diesem Fall können Sie diese äquivalente Formel verwenden:
Wenn wir beispielsweise eine statistische Stichprobe von 100 Beobachtungen haben, wird gemäß der Sturges-Regel die Anzahl der Klassen, in die die Daten gruppiert werden sollten, wie folgt berechnet:
Für eine Stichprobe mit insgesamt 100 Datenpunkten müssen die Daten also in 8 verschiedene Intervalle unterteilt werden.
Root-Methode
Obwohl die Regel von Sturges sicherlich bekannter ist, besteht eine andere in der Statistik weit verbreitete Methode zur Berechnung der Klassenanzahl darin, die Quadratwurzel der Stichprobengröße zu berechnen.
Eine weitere Formel zur Berechnung der idealen Klassenanzahl lautet also wie folgt:
Gold
ist die Anzahl der Klassen oder Intervalle und
ist die Gesamtzahl der Datenelemente in der Stichprobe.
Wenn wir beispielsweise insgesamt 150 Daten haben, würde die Berechnung der Anzahl der Intervalle, in die wir die Daten unterteilen müssen, wie folgt aussehen:
Die vorherige Formel wird verwendet, wenn die Stichprobengröße weniger als 200 beträgt. Wenn wir jedoch 200 oder mehr Daten haben, ist es besser, die Anzahl der Klassen durch Ziehen der Kubikwurzel zu berechnen:
Gold
ist die Anzahl der Klassen oder Intervalle und
ist die Gesamtzahl der Datenelemente in der Stichprobe.
Anzahl der Klassen und Intervallbreite
Nachdem wir die Anzahl der Abschnitte berechnet haben, können wir mithilfe der folgenden Formel berechnen, wie breit jedes Intervall sein sollte:
Als Beispiel wird unten eine Übung gelöst, damit Sie sehen können, wie die Breite von Intervallen berechnet wird.
- Die folgenden statistischen Daten wurden aufgezeichnet. Berechnen Sie die Anzahl der Klassen mit der Sturges-Regel und bestimmen Sie dann die Breite jedes Intervalls.
Wie wir oben gesehen haben, wenden wir die Sturges-Regel an, um die Anzahl der Klassen zu bestimmen, in die die Daten gruppiert werden sollen. In diesem Fall haben wir 39 Daten, also müssen wir in der Formel den Parameter N durch 39 ersetzen:
Nachdem wir nun die entsprechende Anzahl von Klassen kennen, berechnen wir die Breite jeder Klasse. Dazu müssen wir zunächst den Bereich der Beispieldaten berechnen:
Und sobald wir den Umfang der Stichprobe kennen, dividieren wir den gefundenen Wert durch die Anzahl der zuvor berechneten Klassen (6):
Die Breite aller Klassen muss daher 16 Einheiten betragen. Daher könnten wir folgende Klassen erreichen:
Anzahl der Klassen in einer Häufigkeitsverteilung
Abschließend ist zu beachten, dass die Berechnung der Anzahl der Klassen bei der Erstellung einer Häufigkeitsverteilung (oder Häufigkeitstabelle) wichtig ist. Auf diese Weise können Sie die Daten schnell in verschiedene Intervalle aufteilen und dann alle Arten von Häufigkeiten jedes Intervalls ermitteln. .
Falls Sie nicht wissen, was es ist: Eine Häufigkeitsverteilung ist eine Tabelle, die alle Häufigkeitstypen für jedes Intervall auflistet. Jede Zeile ist also eine andere Klasse und jede Spalte hat einen anderen Häufigkeitstyp.
Um ein Beispiel einer Häufigkeitsverteilung mit gruppierten Daten anzuzeigen, klicken Sie auf den folgenden Link: