Comment effectuer le test exact de Fisher en Python



Le test exact de Fisher est utilisé pour déterminer s’il existe ou non une association significative entre deux variables catégorielles.

Il est généralement utilisé comme alternative au test d’indépendance du chi carré lorsqu’un ou plusieurs comptes de cellules dans un tableau 2 × 2 sont inférieurs à 5.

Ce didacticiel explique comment effectuer le test exact de Fisher en Python.

Exemple : test exact de Fisher en Python

Supposons que nous voulions savoir si le sexe est associé ou non à la préférence pour un parti politique dans un collège particulier.

Pour explorer cela, nous interrogeons au hasard 25 étudiants sur le campus. Le nombre d’étudiants démocrates ou républicains, en fonction de leur sexe, est indiqué dans le tableau ci-dessous :

Démocrate Républicain
Femelle 8 4
Mâle 4 9

Pour déterminer s’il existe une association statistiquement significative entre le sexe et la préférence pour le parti politique, nous pouvons utiliser les étapes suivantes pour effectuer le test exact de Fisher en Python :

Étape 1 : Créez les données.

Tout d’abord, nous allons créer un tableau pour contenir nos données :

data = [[8, 4],
         [4, 9]]

Étape 2 : Effectuez le test exact de Fisher.

Ensuite, nous pouvons effectuer le test exact de Fisher en utilisant la fonction fisher_exact de la bibliothèque SciPy, qui utilise la syntaxe suivante :

fisher_exact(table, alternative=’deux faces’)

où:

  • table : Un tableau de contingence 2×2
  • alternative : définit l’hypothèse alternative. La valeur par défaut est « bilatérale », mais vous pouvez également choisir « moins » ou « supérieur » pour les tests unilatéraux.

Le code suivant montre comment utiliser cette fonction dans notre exemple spécifique :

import scipy.stats as stats

print(stats.fisher_exact(data))

(4.5, 0.1152)

La valeur p pour les tests est de 0,1152 .

Le test exact de Fisher utilise les hypothèses nulles et alternatives suivantes :

  • H 0 : (hypothèse nulle) Les deux variables sont indépendantes.
  • H 1 : (hypothèse alternative) Les deux variables ne sont pas indépendantes.

Puisque cette valeur p n’est pas inférieure à 0,05, nous ne rejetons pas l’hypothèse nulle.

Nous ne disposons donc pas de preuves suffisantes pour affirmer qu’il existe une association significative entre le sexe et les préférences en matière de parti politique.

En d’autres termes, le sexe et les préférences en matière de parti politique sont indépendants.

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *