Eine kurze einführung in die bivariate analyse
Der Begriff bivariate Analyse bezieht sich auf die Analyse zweier Variablen. Sie können sich das merken, denn das Präfix „bi“ bedeutet „zwei“.
Das Ziel der bivariaten Analyse besteht darin, die Beziehung zwischen zwei Variablen zu verstehen. Sie können diese Art der Analyse mit Folgendem vergleichen:
- Univariate Analyse : Die Analyse einer Variablen.
- Multivariate Analyse: Analyse von zwei oder mehr Variablen.
Es gibt drei gängige Methoden zur Durchführung einer bivariaten Analyse:
1. Streudiagramme.
2. Korrelationskoeffizienten.
3. Einfache lineare Regression.
Dieses Tutorial bietet ein Beispiel für jede dieser Arten der bivariaten Analyse unter Verwendung des folgenden Datensatzes, der Informationen zu zwei Variablen enthält: (1) Stunden, die mit dem Lernen verbracht wurden, und (2) Prüfungsergebnisse, die von 20 verschiedenen Studenten erzielt wurden:
1. Punktwolken
Ein Streudiagramm bietet eine visuelle Möglichkeit, eine bivariate Analyse durchzuführen. Es ermöglicht uns, die Beziehung zwischen zwei Variablen zu visualisieren, indem wir den Wert einer Variablen auf der x-Achse und den Wert der anderen Variablen auf der y-Achse platzieren.
Im Streudiagramm unten tragen wir die gelernten Stunden auf der x-Achse und die Prüfungsergebnisse auf der y-Achse ein:
Wir können deutlich erkennen, dass zwischen den beiden Variablen ein positiver Zusammenhang besteht: Mit zunehmender Anzahl der Lernstunden steigen tendenziell auch die Prüfungsergebnisse.
2. Korrelationskoeffizienten
Ein Korrelationskoeffizient bietet eine weitere Möglichkeit zur Durchführung einer bivariaten Analyse. Der gebräuchlichste Typ von Korrelationskoeffizienten ist der Pearson-Korrelationskoeffizient , der ein Maß für den linearen Zusammenhang zwischen zwei Variablen ist. Es hat einen Wert zwischen -1 und 1, wobei:
- -1 zeigt eine vollkommen negative lineare Korrelation zwischen zwei Variablen an
- 0 bedeutet, dass zwischen zwei Variablen keine lineare Korrelation besteht
- 1 zeigt eine vollkommen positive lineare Korrelation zwischen zwei Variablen an
Diese einfache Metrik gibt uns eine gute Vorstellung davon, wie zwei Variablen zusammenhängen. In der Praxis verwenden wir häufig Streudiagramme und Korrelationskoeffizienten, um die Beziehung zwischen zwei Variablen zu verstehen, damit wir ihre Beziehung visualisieren und quantifizieren können.
3. Einfache lineare Regression
Eine dritte Möglichkeit zur Durchführung einer bivariaten Analyse ist die Verwendungeiner einfachen linearen Regression .
Bei dieser Methode wählen wir eine Variable als erklärende Variable und die andere Variable als Antwortvariable . Wir finden dann die Zeile, die am besten zum Datensatz „passt“, anhand derer wir dann die genaue Beziehung zwischen den beiden Variablen verstehen können.
Die am besten geeignete Zeile für den obigen Datensatz lautet beispielsweise:
Prüfungsergebnis = 69,07 + 3,85*(Studienstunden)
Dies bedeutet, dass jede weitere gelernte Stunde mit einer durchschnittlichen Prüfungspunktzahlsteigerung von 3,85 verbunden ist. Durch die Anpassung dieses linearen Regressionsmodells können wir die genaue Beziehung zwischen den gelernten Stunden und der Prüfungsnote quantifizieren.
Verwandte Themen: So führen Sie eine einfache lineare Regression in Excel durch
Abschluss
Die bivariate Analyse ist eine der am häufigsten verwendeten Analysearten in der Statistik, da wir häufig die Beziehung zwischen zwei Variablen verstehen möchten.
Mithilfe von Streudiagrammen, Korrelationskoeffizienten und einfacher linearer Regression können wir die Beziehung zwischen zwei Variablen visualisieren und quantifizieren.
Häufig werden diese drei Methoden in einer Analyse gemeinsam verwendet, um ein vollständiges Bild der Beziehung zwischen zwei Variablen zu erhalten. Daher ist es eine gute Idee, sich mit jeder Methode vertraut zu machen.