Comment effectuer le test post-hoc Nemenyi en Python



Le test de Friedman est une alternative non paramétrique à l’ ANOVA à mesures répétées . Il est utilisé pour déterminer s’il existe ou non une différence statistiquement significative entre les moyennes de trois groupes ou plus dans lesquels les mêmes sujets apparaissent dans chaque groupe.

Si la valeur p du test de Friedman est statistiquement significative, nous pouvons alors effectuer le test post-hoc de Nemenyi pour déterminer exactement quels groupes sont différents.

L’exemple suivant, étape par étape, montre comment effectuer le test Nemenyi en Python.

Étape 1 : Créer les données

Supposons qu’un chercheur veuille savoir si les temps de réaction des patients sont égaux avec trois médicaments différents. Pour tester cela, il mesure le temps de réaction (en secondes) de 10 patients différents à chacun des trois médicaments.

Nous pouvons créer les trois tableaux suivants qui contiennent les temps de réponse pour chaque patient sur chacun des trois médicaments :

group1 = [4, 6, 3, 4, 3, 2, 2, 7, 6, 5]
group2 = [5, 6, 8, 7, 7, 8, 4, 6, 4, 5]
group3 = [2, 2, 5, 3, 2, 2, 1, 4, 3, 2]

Étape 2 : Effectuer le test de Friedman

Ensuite, nous effectuerons le test de Friedman en utilisant la fonction friedmanchisquare() de la bibliothèque scipy.stats :

from scipy import stats

#perform Friedman Test
stats.friedmanchisquare(group1, group2, group3)

FriedmanchisquareResult(statistic=13.3513513, pvalue=0.00126122012)

Le test de Friedman utilise les hypothèses nulles et alternatives suivantes :

L’hypothèse nulle (H 0 ) : La moyenne de chaque population est égale.

L’hypothèse alternative : (Ha) : Au moins une moyenne de population est différente des autres.

Dans cet exemple, la statistique de test est 13,35135 et la valeur p correspondante est 0,00126 . Puisque cette valeur p est inférieure à 0,05, nous pouvons rejeter l’hypothèse nulle selon laquelle le temps de réponse moyen est le même pour les trois médicaments.

En d’autres termes, nous disposons de suffisamment de preuves pour conclure que le type de médicament utilisé entraîne des différences statistiquement significatives dans le temps de réponse.

Étape 3 : Effectuer le test Nemenyi

Ensuite, nous pouvons effectuer le test post-hoc de Nemenyi pour déterminer exactement quels groupes ont des moyennes différentes.

Pour ce faire, nous devons installer la bibliothèque scikit-posthocs :

pip install scikit-posthocs

Ensuite, nous utiliserons la fonction posthoc_nemenyi_friedman() pour effectuer le test post-hoc de Nemenyi :

import scikit_posthocs as sp
import numpy as np

#combine three groups into one array
data = np.array([group1, group2, group3])

#perform Nemenyi post-hoc test
sp.posthoc_nemenyi_friedman(data.T)

	0	        1	        2
0	1.000000	0.437407	0.065303
1	0.437407	1.000000	0.001533
2	0.065303	0.001533	1.000000

Remarque : Nous avons dû transposer le tableau numpy (data.T) afin de réaliser correctement le test post-hoc.

Le test post-hoc de Nemeyi renvoie les valeurs p pour chaque comparaison par paire des moyennes. À partir du résultat, nous pouvons voir les valeurs p suivantes :

  • Valeur P du groupe 0 par rapport au groupe 1 : 0,4374
  • Valeur P du groupe 0 par rapport au groupe 2 : 0,0653
  • Valeur P du groupe 1 par rapport au groupe 2 : 0,0015

À α = 0,05, les deux seuls groupes qui ont des moyennes statistiquement significativement différentes sont le groupe 1 et le groupe 2.

Remarque : Le test de Nemenyi a converti le numéro de groupe de 1, 2, 3 en 0, 1, 2. Ainsi, les groupes des données originales qui sont significativement différents sont les groupes 2 et 3.

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *