Gruppierte daten
In diesem Artikel wird erläutert, was gruppierte Daten sind und wie Daten gruppiert werden. Zusätzlich finden Sie eine gelöste Übung, in der die Daten nach Intervallen gruppiert sind.
Was sind gruppierte Daten?
In der Statistik sind gruppierte Daten in Intervallen gruppierte Daten. Mit anderen Worten handelt es sich bei gruppierten Daten um Daten, die in regelmäßigen Abständen gesammelt werden, damit sie gemeinsam untersucht werden können.
Wenn man also einen Satz statistischer Daten gruppiert, wird er in verschiedene Intervalle unterteilt, sodass jedes Datenelement nur zu einem Intervall gehören kann.
Kurz gesagt: In der Statistik ermöglicht die Datenclusterung die gemeinsame Analyse mehrerer Daten, sodass innerhalb eines Intervalls gruppierte Daten als ein einziges Datenelement behandelt werden. Darüber hinaus ist das Datenpooling sehr nützlich, wenn die Stichprobe sehr groß ist.
Beispiel für gruppierte Daten
Im Folgenden sehen Sie die Definition gruppierter Daten. Nachfolgend finden Sie ein konkretes Beispiel dafür, wie ein Datensatz in verschiedene Intervalle gruppiert wird.
- Die Stichprobengröße von 50 verschiedenen Personen wurde gemessen und alle Werte in der folgenden Datentabelle aufgezeichnet. Gruppieren Sie den Datensatz in Intervalle und stellen Sie die Daten dann grafisch dar.
Zuerst müssen wir die Daten in Intervalle unterteilen. Dafür gibt es viele Methoden, aber die Regel von Sturges wird am häufigsten verwendet, da sie es Ihnen ermöglicht, die ideale Anzahl von Intervallen zu berechnen:
Wir müssen die Daten also in sieben verschiedene Intervalle unterteilen. Wir müssen nun die Breite kennen, die jedes Intervall haben muss. Teilen Sie dazu einfach den Maximalwert minus dem Minimalwert durch die Gesamtzahl der Intervalle:
Kurz gesagt, es müssen 7 Intervalle mit der Amplitude 9 vorhanden sein, sodass die nach der Sturges-Regel berechneten Intervalle wie folgt lauten:
Und nachdem wir die Intervalle berechnet haben, zählen wir, wie oft ein Datenelement in jedem Intervall erscheint, und erstellen eine Tabelle mit den gruppierten Daten:
Beachten Sie, dass aus gruppierten Daten noch mehr Häufigkeitsarten berechnet werden können (relative Häufigkeit, kumulative Häufigkeit usw.). Um zu sehen, wie Sie eine vollständige Häufigkeitstabelle mit gruppierten Daten erstellen, klicken Sie hier:
Schließlich können wir aus der Tabelle mit der Häufigkeit jedes Intervalls die in einem Histogramm gruppierten Daten grafisch darstellen.
Gruppierte und nicht gruppierte Daten
Nicht gruppierte Daten sind Daten, die nicht in Intervalle unterteilt sind, sondern jeder Wert separat untersucht wird.
Wenn wir dem oben ausgearbeiteten Beispiel folgen und die Daten nicht gruppiert hätten, hätten wir die Häufigkeit jedes Werts ermitteln müssen. Das heißt, wir hätten berechnen sollen, wie oft der Wert 158, 165, 174 usw. ist. wird wiederholt. In diesem Fall war es jedoch besser, die Daten nach Intervallen zu gruppieren, da wir über eine große Datenmenge verfügten und außerdem viele Werte ähnlich waren.
Daher ist es bei einer statistischen Studie wichtig, vor der Durchführung von Berechnungen zu entscheiden, ob die Daten nach Intervallen gruppiert werden sollen oder nicht, da dies den Rest der Untersuchung beeinflusst.
Wann sollten Daten konsolidiert werden?
Im Allgemeinen sollten Daten in Intervallen gruppiert werden, wenn die Variable kontinuierlich ist. Wenn die Variable kontinuierlich ist, haben wir normalerweise viele Werte und sie liegen sehr nahe beieinander, sodass sie zur Vereinfachung der Studie in Intervalle gruppiert werden können.
Selbst wenn die Variable nicht kontinuierlich ist, können wir sie logischerweise auch in Intervallen gruppieren, wenn wir viele Daten haben, was die statistische Analyse erleichtert. Aber im Allgemeinen ist das Kriterium für die Gruppierung von Daten die Art der Variablen: Wenn die Variable kontinuierlich ist, werden die Daten im Allgemeinen in Intervalle unterteilt.