Come eseguire un'ancova in python


Un’ANCOVA (“analisi della covarianza”) viene utilizzata per determinare se esiste o meno una differenza statisticamente significativa tra le medie di tre o più gruppi indipendenti, dopo aver controllato una o più covariate .

Questo tutorial spiega come eseguire un ANCOVA in Python.

Esempio: ANCOVA in Python

Un insegnante vuole sapere se tre diverse tecniche di studio influiscono sui punteggi degli esami, ma vuole prendere in considerazione il voto attuale che lo studente ha già ottenuto in classe.

Eseguirà un’ANCOVA utilizzando le seguenti variabili:

  • Fattore variabile: studio tecnico
  • Covariata: punteggio corrente
  • Variabile di risposta: punteggio dell’esame

Seguire i seguenti passaggi per eseguire un’ANCOVA su questo set di dati:

Passaggio 1: inserisci i dati.

Innanzitutto, creeremo un DataFrame panda per contenere i nostri dati:

 import numpy as np
import pandas as pd

#create data
df = pd.DataFrame({'technique': np.repeat(['A', 'B', 'C'], 5),
                   'current_grade': [67, 88, 75, 77, 85,
                                     92, 69, 77, 74, 88, 
                                     96, 91, 88, 82, 80],
                   'exam_score': [77, 89, 72, 74, 69,
                                  78, 88, 93, 94, 90,
                                  85, 81, 83, 88, 79]})
#view data 
df

   technical current_grade exam_score
0 A 67 77
1 A 88 89
2 A 75 72
3 A 77 74
4 A 85 69
5 B 92 78
6 B 69 88
7 B 77 93
8 B 74 94
9 B 88 90
10 C 96 85
11 C 91 81
12 C 88 83
13 C 82 88
14 C 80 79

Passaggio 2: eseguire ANCOVA.

Successivamente, eseguiremo un’ANCOVA utilizzando la funzione ancova() dalla libreria penguin:

 pip install penguin 
from penguin import ancova

#perform ANCOVA
ancova(data= df , dv=' exam_score ', covar=' current_grade ', between=' technique ')


        Source SS DF F p-unc np2
0 technical 390.575130 2 4.80997 0.03155 0.46653
1 current_grade 4.193886 1 0.10329 0.75393 0.00930
2 Residual 446.606114 11 NaN NaN NaN

Passaggio 3: interpretare i risultati.

Dalla tabella ANCOVA, vediamo che il valore p (p-unc = “valore p non corretto”) per la tecnica di studio è 0,03155 . Poiché questo valore è inferiore a 0,05, possiamo rifiutare l’ipotesi nulla secondo cui ciascuna delle tecniche di studio porta allo stesso voto medio dell’esame, anche dopo aver tenuto conto del voto attuale dello studente nella classe .

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *