So führen sie eine ancova in python durch
Eine ANCOVA („Kovarianzanalyse“) wird verwendet, um zu bestimmen, ob ein statistisch signifikanter Unterschied zwischen den Mittelwerten von drei oder mehr unabhängigen Gruppen besteht, nachdem eine oder mehrere Kovariaten kontrolliert wurden.
In diesem Tutorial wird erklärt, wie man eine ANCOVA in Python durchführt.
Beispiel: ANCOVA in Python
Eine Lehrerin möchte wissen, ob sich drei verschiedene Lerntechniken auf die Prüfungsergebnisse auswirken, möchte aber die aktuelle Note berücksichtigen, die der Schüler bereits in der Klasse hat.
Es wird eine ANCOVA unter Verwendung der folgenden Variablen durchgeführt:
- Faktorvariable: technische Studie
- Kovariate: aktuelle Punktzahl
- Antwortvariable: Prüfungsergebnis
Befolgen Sie die folgenden Schritte, um eine ANCOVA für diesen Datensatz durchzuführen:
Schritt 1: Geben Sie die Daten ein.
Zuerst erstellen wir einen Pandas-DataFrame zur Speicherung unserer Daten:
import numpy as np import pandas as pd #create data df = pd.DataFrame({'technique': np.repeat(['A', 'B', 'C'], 5), 'current_grade': [67, 88, 75, 77, 85, 92, 69, 77, 74, 88, 96, 91, 88, 82, 80], 'exam_score': [77, 89, 72, 74, 69, 78, 88, 93, 94, 90, 85, 81, 83, 88, 79]}) #view data df technical current_grade exam_score 0 A 67 77 1 A 88 89 2 A 75 72 3 A 77 74 4 A 85 69 5 B 92 78 6 B 69 88 7 B 77 93 8 B 74 94 9 B 88 90 10 C 96 85 11 C 91 81 12 C 88 83 13 C 82 88 14 C 80 79
Schritt 2: ANCOVA durchführen.
Als nächstes führen wir eine ANCOVA mit der Funktion ancova() aus der Penguin-Bibliothek durch:
pip install penguin from penguin import ancova #perform ANCOVA ancova(data= df , dv=' exam_score ', covar=' current_grade ', between=' technique ') Source SS DF F p-unc np2 0 technical 390.575130 2 4.80997 0.03155 0.46653 1 current_grade 4.193886 1 0.10329 0.75393 0.00930 2 Residual 446.606114 11 NaN NaN NaN
Schritt 3: Interpretieren Sie die Ergebnisse.
Aus der ANCOVA-Tabelle sehen wir, dass der p-Wert (p-unc = „unkorrigierter p-Wert“) für die Studientechnik 0,03155 beträgt. Da dieser Wert kleiner als 0,05 ist, können wir die Nullhypothese ablehnen, dass jede der Lerntechniken zu derselben durchschnittlichen Prüfungsnote führt, selbst wenn die aktuelle Note des Schülers in der Klasse berücksichtigt wird .