Comment effectuer le test de Levene en Python
Le test de Levene est utilisé pour déterminer si deux groupes ou plus ont des variances égales. Il est couramment utilisé car de nombreux tests statistiques supposent que les groupes ont des variances égales et le test de Levene vous permet de déterminer si cette hypothèse est satisfaite.
Ce tutoriel explique comment effectuer le test de Levene en Python.
Exemple : test de Levene en Python
Les chercheurs veulent savoir si trois engrais différents conduisent à différents niveaux de croissance des plantes. Ils sélectionnent au hasard 30 plantes différentes et les divisent en trois groupes de 10, en appliquant un engrais différent à chaque groupe. Au bout d’un mois, ils mesurent la hauteur de chaque plante.
Utilisez les étapes suivantes pour effectuer le test de Levene en Python afin de déterminer si les trois groupes ont ou non des variances égales.
Étape 1 : Saisissez les données.
Tout d’abord, nous allons créer trois tableaux pour contenir les valeurs des données :
group1 = [7, 14, 14, 13, 12, 9, 6, 14, 12, 8] group2 = [15, 17, 13, 15, 15, 13, 9, 12, 10, 8] group3 = [6, 8, 8, 9, 5, 14, 13, 8, 10, 9]
Étape 2 : Effectuez le test de Levene.
Ensuite, nous effectuerons le test de Levene en utilisant la fonction levene() de la bibliothèque SciPy, qui utilise la syntaxe suivante :
levene(sample1, sample2, …, center=’médian’)
où:
- sample1, sample2, etc : Noms des échantillons.
- centre : Méthode à utiliser pour le test de Levene. La valeur par défaut est « médiane », mais d’autres choix incluent « moyenne » et « rogné ».
Comme mentionné dans la documentation , il existe en fait trois variantes différentes du test de Levene que vous pouvez utiliser. Les utilisations recommandées sont les suivantes :
- « médiane » : recommandé pour les distributions asymétriques.
- « moyenne » : recommandé pour les distributions symétriques à queue modérée.
- ‘trimmed’ : recommandé pour les distributions à queue lourde.
Le code suivant illustre comment effectuer le test de Levene en utilisant à la fois la moyenne et la médiane comme centre :
import scipy.stats as stats #Levene's test centered at the median stats.levene(group1, group2, group3, center='median') (statistic=0.1798, pvalue=0.8364) #Levene's test centered at the mean stats.levene(group1, group2, group3, center='mean') (statistic=0.5357, pvalue=0.5914)
Dans les deux méthodes, la valeur p n’est pas inférieure à 0,05. Cela signifie que dans les deux cas, nous ne parviendrons pas à rejeter l’hypothèse nulle. Cela signifie que nous ne disposons pas de preuves suffisantes pour affirmer que la variance de la croissance des plantes entre les trois engrais est significativement différente.
Autrement dit, les trois groupes ont des variances égales. Si nous devions effectuer un test statistique (comme une ANOVA unidirectionnelle ) qui suppose que chaque groupe a une variance égale, alors cette hypothèse serait remplie.