Was ist univariate analyse? (definition & #038; beispiel)
Der Begriff univariate Analyse bezieht sich auf die Analyse einer Variablen. Sie können sich das merken, denn das Präfix „uni“ bedeutet „eins“.
Das Ziel der univariaten Analyse besteht darin, die Werteverteilung für eine einzelne Variable zu verstehen. Sie können diese Art der Analyse mit Folgendem vergleichen:
- Bivariate Analyse : Die Analyse zweier Variablen.
- Multivariate Analyse: Analyse von zwei oder mehr Variablen.
Angenommen, wir haben den folgenden Datensatz:
Wir könnten uns dafür entscheiden, eine univariate Analyse für eine der einzelnen Variablen im Datensatz durchzuführen, um deren Werteverteilung besser zu verstehen.
Beispielsweise können wir eine univariate Analyse für die Variable Haushaltsgröße durchführen:
Es gibt drei gängige Methoden zur Durchführung einer univariaten Analyse:
1. Zusammenfassende Statistiken
Die gebräuchlichste Methode zur Durchführung einer univariaten Analyse besteht darin, eine Variable mithilfevon zusammenfassenden Statistiken zu beschreiben.
Es gibt zwei gängige Arten von zusammenfassenden Statistiken:
- Maße der zentralen Tendenz : Diese Zahlen beschreiben, wo sich das Zentrum eines Datensatzes befindet. Beispiele hierfür sind Mittelwert und Median .
- Streuungsmaße : Diese Zahlen beschreiben die Verteilung der Werte im Datensatz. Beispiele hierfür sind Intervall , Interquartilbereich , Standardabweichung und Varianz .
2. Häufigkeitsverteilungen
Eine andere Möglichkeit, eine univariate Analyse durchzuführen, besteht darin, eine Häufigkeitsverteilung zu erstellen, die beschreibt, wie oft verschiedene Werte in einem Datensatz vorkommen.
3. Grafiken
Eine andere Möglichkeit, eine univariate Analyse durchzuführen, besteht darin, Diagramme zu erstellen, um die Werteverteilung für eine bestimmte Variable zu visualisieren.
Häufige Beispiele sind:
- Boxplots
- Histogramme
- Dichtekurven
- Camemberts
Die folgenden Beispiele zeigen, wie jede Art von univariater Analyse mit der Variablen „Haushaltsgröße“ aus unserem zuvor erwähnten Datensatz durchgeführt wird:
Zusammengefasste Statistiken
Wir können die folgenden Maße der zentralen Tendenz der Haushaltsgröße berechnen:
- Durchschnitt (der Durchschnittswert): 3,8
- Median (der Durchschnittswert): 4
Diese Werte geben uns eine Vorstellung davon, wo der „zentrale“ Wert liegt.
Wir können auch die folgenden Ausbreitungsmaße berechnen:
- Bereich (die Differenz zwischen Max und Min): 6
- Interquartilskala (die Verteilung der mittleren 50 % der Werte): 2,5
- Standardabweichung (ein durchschnittliches Maß für die Ausbreitung): 1,87
Diese Werte geben uns eine Vorstellung von der Werteverteilung dieser Variablen.
Häufigkeitsverteilung
Wir können auch die folgende Häufigkeitsverteilungstabelle erstellen, um zusammenzufassen, wie oft unterschiedliche Werte auftreten:
Dadurch können wir schnell erkennen, dass die häufigste Haushaltsgröße 4 Personen beträgt.
Ressource: Mit diesem Häufigkeitsrechner können Sie automatisch eine Häufigkeitsverteilung für jede Variable erstellen.
Grafik
Wir können die folgenden Diagramme erstellen, um die Verteilung der Werte für die Haushaltsgröße zu visualisieren:
1. Boxplot
Ein Boxplot ist ein Diagramm, das die fünfstellige Zusammenfassung eines Datensatzes zeigt.
Die fünfstellige Zusammenfassung umfasst:
- Der Mindestwert
- Das erste Quartil
- Der Medianwert
- Das dritte Quartil
- Der Maximalwert
So würde ein Boxplot für die Variable „Haushaltsgröße“ aussehen:
Ressource: Mit diesem Boxplot-Generator können Sie automatisch einen Boxplot für jede Variable erstellen.
2. Histogramm
Ein Histogramm ist eine Art Diagramm, das vertikale Balken zur Anzeige von Häufigkeiten verwendet. Diese Art von Diagramm ist eine nützliche Möglichkeit, die Verteilung von Werten in einem Datensatz zu visualisieren.
So würde ein Histogramm für die Variable „Haushaltsgröße“ aussehen:
3. Dichtekurve
Eine Dichtekurve ist eine Kurve in einem Diagramm, die die Werteverteilung in einem Datensatz darstellt.
Es ist besonders nützlich, um die „Form“ einer Verteilung zu visualisieren, einschließlich der Frage, ob eine Verteilung einen oder mehrere „Spitzen“ häufiger Werte aufweist und ob die Verteilung nach links oder rechts schief ist oder nicht .
So würde eine Dichtekurve für die Variable „Haushaltsgröße“ aussehen:
4. Kreisdiagramm
Ein Kreisdiagramm ist eine Art Kreisdiagramm und verwendet Abschnitte, um die Proportionen eines Ganzen darzustellen.
So würde ein Kreisdiagramm für die Variable „Haushaltsgröße“ aussehen:
Abhängig von der Art der Daten kann eines dieser Diagramme für die Visualisierung der Werteverteilung nützlicher sein als die anderen.