Come eseguire un'anova a tre vie in python

Di Benjamin anderson Luglio 17, 2023 Guida 0 commenti

Un’ANOVA a tre vie viene utilizzata per determinare se esiste o meno una differenza statisticamente significativa tra le medie di tre o più gruppi indipendenti distribuiti su tre fattori.

L’esempio seguente mostra come eseguire un’ANOVA a tre vie in Python.

Esempio: ANOVA a tre vie in Python

Supponiamo che un ricercatore voglia determinare se due programmi di allenamento portano a diversi miglioramenti medi nell’altezza del salto tra i giocatori di basket del college.

Il ricercatore sospetta che anche il sesso e la divisione (Divisione I o II) possano influenzare l’altezza del salto, motivo per cui raccoglie dati anche su questi fattori.

Il suo obiettivo è eseguire un’ANOVA a tre vie per determinare in che modo il programma di allenamento, il sesso e la divisione influiscono sull’altezza del salto.

Utilizzare i seguenti passaggi per eseguire questa ANOVA a tre vie in Python:

Passaggio 1: creare i dati

Innanzitutto, creiamo un DataFrame panda per contenere i dati:

 import numpy as np
import pandas as pd

#createDataFrame
df = pd. DataFrame ({' program ': np.repeat ([1,2],20),
                   ' gender ': np. tile (np. repeat (['M', 'F'], 10), 2),
                   ' division ': np. tile (np. repeat ([1, 2], 5), 4),
                   ' height ': [7, 7, 8, 8, 7, 6, 6, 5, 6, 5,
                              5, 5, 4, 5, 4, 3, 3, 4, 3, 3,
                              6, 6, 5, 4, 5, 4, 5, 4, 4, 3,
                              2, 2, 1, 4, 4, 2, 1, 1, 2, 1]})

#view first ten rows of DataFrame 
df[:10]

	program gender division height
0 1 M 1 7
1 1 M 1 7
2 1 M 1 8
3 1 M 1 8
4 1 M 1 7
5 1 M 2 6
6 1 M 2 6
7 1 M 2 5
8 1 M 2 6
9 1 M 2 5

Passaggio 2: eseguire l’ANOVA a tre vie

Successivamente, possiamo utilizzare la funzione anova_lm() dalla libreria statsmodels per eseguire l’ANOVA a tre vie:

 import statsmodels. api as sm
from statsmodels. formula . api import ols

#perform three-way ANOVA
model = ols("""height ~ C(program) + C(gender) + C(division) +
               C(program):C(gender) + C(program):C(division) + C(gender):C(division) +
               C(program):C(gender):C(division)""", data=df) .fit ()

sm. stats . anova_lm (model, typ= 2 )

	                          sum_sq df F PR(>F)
C(program) 3.610000e+01 1.0 6.563636e+01 2.983934e-09
C(gender) 6.760000e+01 1.0 1.229091e+02 1.714432e-12
C(division) 1.960000e+01 1.0 3.563636e+01 1.185218e-06
C(program):C(gender) 2.621672e-30 1.0 4.766677e-30 1.000000e+00
C(program):C(division) 4.000000e-01 1.0 7.272727e-01 4.001069e-01
C(gender):C(division) 1.000000e-01 1.0 1.818182e-01 6.726702e-01
C(program):C(gender):C(division) 1.000000e-01 1.0 1.818182e-01 6.726702e-01
Residual 1.760000e+01 32.0 NaN NaN

Passaggio 3: interpretare i risultati

La colonna Pr(>F) mostra il valore p per ogni singolo fattore e le interazioni tra i fattori.

Dai risultati possiamo vedere che nessuna delle interazioni tra i tre fattori era statisticamente significativa.

Possiamo anche vedere che ciascuno dei tre fattori (programma, genere e divisione) era statisticamente significativo con i seguenti valori p:

Valore P del programma : 0,00000000298
Valore P del genere : 0,00000000000171
Valore P della divisione : 0,00000185

In conclusione, diremmo che il programma di allenamento, il genere e la divisione sono tutti indicatori significativi dell’aumento dell’altezza di salto nei giocatori.

Diremmo anche che non ci sono effetti di interazione significativi tra questi tre fattori.

Risorse addizionali

I seguenti tutorial spiegano come adattare altri modelli ANOVA in Python:

Come eseguire ANOVA unidirezionale in Python
Come eseguire un’ANOVA bidirezionale in Python
Come eseguire misure ripetute ANOVA in Python

Informazioni sull'autore

Benjamin anderson

Ciao, sono Benjamin, un professore di statistica in pensione diventato insegnante dedicato di Statorials. Con una vasta esperienza e competenza nel campo della statistica, sono ansioso di condividere le mie conoscenze per potenziare gli studenti attraverso Statorials. Scopri di più

Esempio: ANOVA a tre vie in Python

Risorse addizionali

Informazioni sull'autore

Benjamin anderson

Aggiungi un commento