Une explication des valeurs P et de la signification statistique
En statistiques, les valeurs p sont couramment utilisées dans les tests d’hypothèse pour les tests t, les tests du chi carré, l’analyse de régression, les ANOVA et diverses autres méthodes statistiques.
Bien qu’elles soient si courantes, les gens interprètent souvent les valeurs p de manière incorrecte, ce qui peut conduire à des erreurs lors de l’interprétation des résultats d’une analyse ou d’une étude.
Cet article explique comment comprendre et interpréter les valeurs p de manière claire et pratique.
Tests d’hypothèses
Pour comprendre les valeurs p, nous devons d’abord comprendre le concept de test d’hypothèse .
Un test d’hypothèse est un test statistique formel que nous utilisons pour rejeter ou échouer à rejeter une hypothèse. Par exemple, nous pouvons émettre l’hypothèse qu’un nouveau médicament, une nouvelle méthode ou une procédure présente certains avantages par rapport à un médicament, une méthode ou une procédure actuelle.
Pour tester cela, nous pouvons effectuer un test d’hypothèse où nous utilisons une hypothèse nulle et alternative :
Hypothèse nulle – Il n’y a aucun effet ni différence entre la nouvelle méthode et l’ancienne méthode.
Hypothèse alternative – Il existe un effet ou une différence entre la nouvelle méthode et l’ancienne méthode.
Une valeur p indique dans quelle mesure l’hypothèse nulle est crédible, compte tenu des données de l’échantillon. Plus précisément, en supposant que l’hypothèse nulle est vraie, la valeur p nous indique la probabilité d’obtenir un effet au moins aussi important que celui que nous avons réellement observé dans les données de l’échantillon.
Si la valeur p d’un test d’hypothèse est suffisamment faible, nous pouvons rejeter l’hypothèse nulle. Plus précisément, lorsque nous effectuons un test d’hypothèse, nous devons choisir dès le départ un niveau de signification. Les choix courants pour les niveaux de signification sont 0,01, 0,05 et 0,10.
Si les valeurs p sont inférieures à notre niveau de signification, nous pouvons alors rejeter l’hypothèse nulle.
Sinon, si la valeur p est égale ou supérieure à notre niveau de signification, nous ne parvenons pas à rejeter l’hypothèse nulle.
Comment interpréter une valeur P
La définition classique d’une valeur p est la suivante :
Une valeur p est la probabilité d’observer une statistique d’échantillon qui est au moins aussi extrême que la statistique de votre échantillon, étant donné que l’hypothèse nulle est vraie.
Par exemple, supposons qu’une usine prétende produire des pneus d’un poids moyen de 200 livres. Un auditeur émet l’hypothèse que le poids moyen réel des pneus produits dans cette usine est différent de 200 livres. Il effectue donc un test d’hypothèse et constate que la valeur p du test est de 0,04. Voici comment interpréter cette valeur p :
Si l’usine produit effectivement des pneus d’un poids moyen de 200 livres, alors 4 % de tous les audits obtiendront l’effet observé dans l’échantillon, ou plus, en raison d’une erreur d’échantillonnage aléatoire. Cela nous indique que l’obtention des échantillons de données obtenus par l’auditeur serait assez rare si l’usine produisait effectivement des pneus d’un poids moyen de 200 livres.
Selon le niveau de signification utilisé dans ce test d’hypothèse, l’auditeur rejetterait probablement l’hypothèse nulle selon laquelle le poids moyen réel des pneus produits dans cette usine est effectivement de 200 livres. Les échantillons de données qu’il a obtenus lors de l’audit ne sont pas très cohérents avec l’hypothèse nulle.
Comment ne pas interpréter une valeur P
La plus grande idée fausse à propos des valeurs p est qu’elles équivalent à la probabilité de commettre une erreur en rejetant une véritable hypothèse nulle (appelée erreur de type I).
Il y a deux raisons principales pour lesquelles les valeurs p ne peuvent pas correspondre au taux d’erreur :
1. Les valeurs P sont calculées sur la base de l’hypothèse que l’hypothèse nulle est vraie et que la différence entre les données de l’échantillon et l’hypothèse nulle est simplement due au hasard. Ainsi, les valeurs p ne peuvent pas vous indiquer la probabilité que la valeur nulle soit vraie ou fausse puisqu’elle est vraie à 100 % selon la perspective des calculs.
2. Bien qu’une valeur p faible indique que vos données d’échantillon sont peu probables en supposant que la valeur nulle est vraie, une valeur p ne peut toujours pas vous dire lequel des cas suivants est le plus probable :
- Le nul est faux
- La valeur nulle est vraie mais vous avez obtenu un échantillon étrange
Par rapport à l’exemple précédent, voici une manière correcte et incorrecte d’interpréter la valeur p :
- Interprétation correcte : en supposant que l’usine produit des pneus d’un poids moyen de 200 livres, vous obtiendriez la différence observée que vous avez obtenue dans votre échantillon ou une différence plus extrême dans 4 % des audits en raison d’une erreur d’échantillonnage aléatoire.
- Interprétation incorrecte : si vous rejetez l’hypothèse nulle, il y a 4 % de chances que vous fassiez une erreur.
Exemples d’interprétation des valeurs P
Les exemples suivants illustrent les manières correctes d’interpréter les valeurs p dans le contexte du test d’hypothèse.
Exemple 1
Une compagnie de téléphone affirme que 90 % de ses clients sont satisfaits de leur service. Pour tester cette affirmation, un chercheur indépendant a rassemblé un échantillon aléatoire simple de 200 clients et leur a demandé s’ils étaient satisfaits de leur service, ce à quoi 85 % ont répondu oui. La valeur p associée à cet échantillon de données s’est avérée être de 0,018.
Interprétation correcte de la valeur p : en supposant que 90 % des clients sont réellement satisfaits de leur service, le chercheur obtiendrait la différence observée qu’il a obtenue dans son échantillon ou une différence plus extrême dans 1,8 % des audits en raison d’une erreur d’échantillonnage aléatoire. .
Exemple 2
Une entreprise invente une nouvelle batterie pour téléphones. La société affirme que cette nouvelle batterie fonctionnera au moins 10 minutes de plus que l’ancienne batterie. Pour tester cette affirmation, un chercheur prélève un échantillon aléatoire simple de 80 piles neuves et de 80 piles anciennes. Les nouvelles batteries fonctionnent en moyenne 120 minutes avec un écart type de 12 minutes et les anciennes batteries fonctionnent en moyenne 115 minutes avec un écart type de 15 minutes. La valeur p résultant du test de différence dans les moyennes de la population est de 0,011.
Interprétation correcte de la valeur p : en supposant que la nouvelle batterie fonctionne pendant la même durée ou moins que l’ancienne batterie, le chercheur obtiendrait la différence observée ou une différence plus extrême dans 1,1 % des études en raison d’une erreur d’échantillonnage aléatoire.