Come eseguire un'ancova in python
Un’ANCOVA (“analisi della covarianza”) viene utilizzata per determinare se esiste o meno una differenza statisticamente significativa tra le medie di tre o più gruppi indipendenti, dopo aver controllato una o più covariate .
Questo tutorial spiega come eseguire un ANCOVA in Python.
Esempio: ANCOVA in Python
Un insegnante vuole sapere se tre diverse tecniche di studio influiscono sui punteggi degli esami, ma vuole prendere in considerazione il voto attuale che lo studente ha già ottenuto in classe.
Eseguirà un’ANCOVA utilizzando le seguenti variabili:
- Fattore variabile: studio tecnico
- Covariata: punteggio corrente
- Variabile di risposta: punteggio dell’esame
Seguire i seguenti passaggi per eseguire un’ANCOVA su questo set di dati:
Passaggio 1: inserisci i dati.
Innanzitutto, creeremo un DataFrame panda per contenere i nostri dati:
import numpy as np import pandas as pd #create data df = pd.DataFrame({'technique': np.repeat(['A', 'B', 'C'], 5), 'current_grade': [67, 88, 75, 77, 85, 92, 69, 77, 74, 88, 96, 91, 88, 82, 80], 'exam_score': [77, 89, 72, 74, 69, 78, 88, 93, 94, 90, 85, 81, 83, 88, 79]}) #view data df technical current_grade exam_score 0 A 67 77 1 A 88 89 2 A 75 72 3 A 77 74 4 A 85 69 5 B 92 78 6 B 69 88 7 B 77 93 8 B 74 94 9 B 88 90 10 C 96 85 11 C 91 81 12 C 88 83 13 C 82 88 14 C 80 79
Passaggio 2: eseguire ANCOVA.
Successivamente, eseguiremo un’ANCOVA utilizzando la funzione ancova() dalla libreria penguin:
pip install penguin from penguin import ancova #perform ANCOVA ancova(data= df , dv=' exam_score ', covar=' current_grade ', between=' technique ') Source SS DF F p-unc np2 0 technical 390.575130 2 4.80997 0.03155 0.46653 1 current_grade 4.193886 1 0.10329 0.75393 0.00930 2 Residual 446.606114 11 NaN NaN NaN
Passaggio 3: interpretare i risultati.
Dalla tabella ANCOVA, vediamo che il valore p (p-unc = “valore p non corretto”) per la tecnica di studio è 0,03155 . Poiché questo valore è inferiore a 0,05, possiamo rifiutare l’ipotesi nulla secondo cui ciascuna delle tecniche di studio porta allo stesso voto medio dell’esame, anche dopo aver tenuto conto del voto attuale dello studente nella classe .