Quel est le taux d’erreur par famille ?



Dans un test d’hypothèse , il existe toujours un taux d’erreur de type I qui nous indique la probabilité de rejeter une hypothèse nulle qui est réellement vraie. En d’autres termes, c’est la probabilité d’obtenir un « faux positif », c’est-à-dire lorsque l’on prétend qu’il y a un effet statistiquement significatif, alors qu’en réalité il n’y en a pas.

Lorsque nous effectuons un test d’hypothèse, le taux d’erreur de type I est égal au niveau de signification (α), qui est généralement choisi comme étant 0,01, 0,05 ou 0,10. Cependant, lorsque nous effectuons plusieurs tests d’hypothèses à la fois, la probabilité d’obtenir un faux positif augmente.

Par exemple, imaginez que nous lançons un dé à 20 faces. La probabilité que le dé tombe sur un « 1 » n’est que de 5 %. Mais si l’on lance deux de ces dés à la fois, la probabilité que l’un des dés tombe sur un « 1 » augmente à 9,75 %. Si nous lançons cinq dés à la fois, la probabilité augmente à 22,6 %.

Plus nous lançons de dés, plus la probabilité que l’un des dés tombe sur un 1 est élevée. De même, si nous effectuons plusieurs tests d’hypothèses à la fois en utilisant un niveau de signification de 0,05, la probabilité que nous obtenions un faux positif augmente au-delà de 0,05. 0,05.

Comment estimer le taux d’erreur par famille

La formule pour estimer le taux d’erreur par famille est la suivante :

Taux d’erreur par famille = 1 – (1-α) n

où:

  • α : le niveau de signification pour un test d’hypothèse unique
  • n : Le nombre total de tests

Par exemple, supposons que nous effectuions 5 comparaisons différentes en utilisant un niveau alpha de α = 0,05. Le taux d’erreur par famille serait calculé comme suit :

Taux d’erreur par famille = 1 – (1-α) c = 1 – (1-.05) 5 = 0,2262 .

En d’autres termes, la probabilité d’obtenir une erreur de type I sur au moins un des tests d’hypothèse est supérieure à 22 % !

Comment contrôler le taux d’erreur par famille

Il existe plusieurs méthodes qui peuvent être utilisées pour contrôler le taux d’erreur par famille, notamment :

1. La correction Bonferroni.

Ajustez la valeur α utilisée pour évaluer la signification de telle sorte que :

α nouveau = α ancien / n

Par exemple, si nous effectuons 5 comparaisons différentes en utilisant un niveau alpha de α = 0,05, alors en utilisant la correction de Bonferroni, notre nouveau niveau alpha serait :

α nouveau = α ancien / n = 0,05 / 5 = 0,01 .

2. La correction Sidak.

Ajustez la valeur α utilisée pour évaluer la signification de telle sorte que :

α nouveau = 1 – (1-α ancien ) 1/n

Par exemple, si nous effectuons 5 comparaisons différentes en utilisant un niveau alpha de α = 0,05, alors en utilisant la correction Sidak, notre nouveau niveau alpha serait :

α nouveau = 1 – (1-α ancien ) 1/n = 1 – (1-.05) 1/5 = .010206 .

3. La correction Bonferroni-Holm.

Cette procédure fonctionne comme suit :

  1. Utilisez la correction de Bonferroni pour calculer α nouveau = α ancien / n.
  2. Effectuez chaque test d’hypothèse et classez les valeurs p de tous les tests de la plus petite à la plus grande.
  3. Si la première valeur p est supérieure ou égale à α new , arrêtez la procédure. Aucune valeur p n’est significative.
  4. Si la première valeur p est inférieure à α new , alors elle est significative. Comparez maintenant la deuxième valeur p à α new . S’il est supérieur ou égal à α new , arrêtez la procédure. Aucune autre valeur p n’est significative.

En utilisant l’une de ces corrections du niveau de signification, nous pouvons réduire considérablement la probabilité de commettre une erreur de type I parmi une famille de tests d’hypothèse.

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *