Hoe een ancova uit te voeren in python
Een ANCOVA (“analyse van covariantie”) wordt gebruikt om te bepalen of er al dan niet een statistisch significant verschil bestaat tussen de gemiddelden van drie of meer onafhankelijke groepen, na controle voor een of meer covariaten .
In deze tutorial wordt uitgelegd hoe u een ANCOVA in Python uitvoert.
Voorbeeld: ANCOVA in Python
Een docent wil weten of drie verschillende studietechnieken van invloed zijn op examenscores, maar ze wil rekening houden met het huidige cijfer dat de leerling al in de klas heeft.
Er wordt een ANCOVA uitgevoerd met behulp van de volgende variabelen:
- Factorvariabele: technische studie
- Covariaat: huidige score
- Responsvariabele: examenscore
Volg de volgende stappen om een ANCOVA op deze dataset uit te voeren:
Stap 1: Voer de gegevens in.
Eerst maken we een Panda DataFrame om onze gegevens op te slaan:
import numpy as np import pandas as pd #create data df = pd.DataFrame({'technique': np.repeat(['A', 'B', 'C'], 5), 'current_grade': [67, 88, 75, 77, 85, 92, 69, 77, 74, 88, 96, 91, 88, 82, 80], 'exam_score': [77, 89, 72, 74, 69, 78, 88, 93, 94, 90, 85, 81, 83, 88, 79]}) #view data df technical current_grade exam_score 0 A 67 77 1 A 88 89 2 A 75 72 3 A 77 74 4 A 85 69 5 B 92 78 6 B 69 88 7 B 77 93 8 B 74 94 9 B 88 90 10 C 96 85 11 C 91 81 12 C 88 83 13 C 82 88 14 C 80 79
Stap 2: Voer ANCOVA uit.
Vervolgens zullen we een ANCOVA uitvoeren met behulp van de ancova() functie uit de pinguïnbibliotheek:
pip install penguin from penguin import ancova #perform ANCOVA ancova(data= df , dv=' exam_score ', covar=' current_grade ', between=' technique ') Source SS DF F p-unc np2 0 technical 390.575130 2 4.80997 0.03155 0.46653 1 current_grade 4.193886 1 0.10329 0.75393 0.00930 2 Residual 446.606114 11 NaN NaN NaN
Stap 3: Interpreteer de resultaten.
Uit de ANCOVA-tabel zien we dat de p-waarde (p-unc = “niet-gecorrigeerde p-waarde”) voor de onderzoekstechniek 0,03155 is. Omdat deze waarde kleiner is dan 0,05, kunnen we de nulhypothese verwerpen dat elk van de studietechnieken tot hetzelfde gemiddelde examencijfer leidt, zelfs nadat rekening is gehouden met het huidige cijfer van de student in de klas .