Statistiques non paramétriques
Dans cet article, nous expliquons ce que sont les statistiques non paramétriques et à quoi elles servent. Vous pourrez également voir un exemple d’application de statistiques non paramétriques et, en plus, quelle est la différence entre les statistiques non paramétriques et les statistiques paramétriques.
Que sont les statistiques non paramétriques ?
Les statistiques non paramétriques sont la branche des statistiques inférentielles qui étudie les variables qui ne correspondent pas à une distribution de probabilité ou dont les paramètres de la distribution ne sont pas définis. Autrement dit, les statistiques non paramétriques sont utilisées pour des variables qui ne peuvent pas être définies avec des modèles théoriques.
Ainsi, les distributions utilisées dans les statistiques non paramétriques ne peuvent pas être définies a priori, mais plutôt les données observées les déterminent.
Les méthodes statistiques non paramétriques sont généralement utilisées lorsque les hypothèses précédentes de certains tests ne sont pas satisfaites, car les statistiques paramétriques nécessitent généralement la réalisation de certaines hypothèses. Ci-dessous, nous verrons quelles sont les différences entre les statistiques non paramétriques et les statistiques paramétriques.
Ainsi, les statistiques non paramétriques sont utilisées pour étudier des populations qui ont un classement, comme les critiques de films qui reçoivent une à cinq étoiles. Une autre application des statistiques non paramétriques est lorsque les données ont un classement mais pas d’interprétation numérique claire, comme lors de l’évaluation des préférences.
Exemple de statistiques non paramétriques
Une fois que nous aurons vu la définition des statistiques non paramétriques, nous allons voir un exemple de son application pour bien comprendre le concept.
Imaginez que nous disposions d’un échantillon statistique composé de 99 observations et que nous souhaitions déterminer la probabilité de la valeur de l’observation suivante (numéro d’observation 100).
Si l’on utilisait des statistiques paramétriques, on calculerait d’abord plusieurs paramètres statistiques de l’échantillon pour connaître ses caractéristiques. Nous pourrions alors effectuer différents tests statistiques en utilisant les paramètres calculés pour déterminer la probabilité de la valeur de la prochaine observation.
Cependant, grâce aux statistiques non paramétriques, nous pouvons connaître des informations sur la valeur suivante sans avoir à calculer les paramètres statistiques de l’échantillon.
Par exemple, si nous avons un échantillon de 99 observations, avec des statistiques non paramétriques, nous pouvons déterminer qu’il y a une probabilité de 1 % que le numéro d’observation 100 soit supérieur à tous les précédents. De cette manière, une estimation non paramétrique du maximum d’un échantillon peut être réalisée.
En bref, grâce aux statistiques non paramétriques, nous pouvons calculer des probabilités et faire des estimations sans avoir besoin de connaître les paramètres statistiques de l’échantillon.
Tests statistiques non paramétriques
Les tests non paramétriques sont des méthodes statistiques basées sur des statistiques non paramétriques. Par conséquent, dans les tests non paramétriques, les variables sont évaluées sans émettre d’hypothèses sur les distributions de probabilité.
Les tests non paramétriques les plus connus sont les suivants :
- test du chi carré
- test binomial
- Test de classement signé par Wilcoxon
- test médian
- Test d’Anderson-Darling
- Test Cochran
- Test Kappa de Cohen
- Test de Fisher
- Test de Friedman
- Test de Kendall
- Test de Kolmogorov-Smirnov
- Test de Kuiper
- Test de Mann-Whitney ou test de Wilcoxon
- Test de McNemar
- Test de Siegel-Tukey
- Test des signes
- Test de Wald-Wolfowitz
Avantages et inconvénients des statistiques non paramétriques
Par rapport aux statistiques paramétriques, les avantages et les inconvénients des statistiques non paramétriques sont les suivants :
Avantage:
- Les statistiques non paramétriques peuvent être appliquées à des données numériques et non numériques.
- En général, les tests non paramétriques ne doivent pas nécessairement répondre à des hypothèses préalables, ce qui leur permet d’être utilisés dans davantage de situations.
- Lorsque la taille de l’échantillon est petite, les tests non paramétriques sont généralement plus rapides à appliquer.
Désavantages:
- Parfois, des informations peuvent être perdues, car les données sont converties en informations qualitatives.
- Lorsque la taille de l’échantillon est grande, la réalisation d’un test non paramétrique est très laborieuse.
- Les tests non paramétriques ont généralement une puissance plus faible, ce qui signifie qu’un échantillon plus grand est nécessaire pour tirer des conclusions avec le même niveau de confiance.
Statistiques non paramétriques et statistiques paramétriques
Enfin, en résumé, voyons quelle est la différence entre les statistiques non paramétriques et les statistiques paramétriques.
Les statistiques paramétriques sont la branche des statistiques inférentielles qui suppose que les données peuvent être modélisées par une distribution de probabilité. Par exemple, le test t de Student est un test paramétrique car il utilise la distribution de probabilité t de Student.
La différence entre les statistiques non paramétriques et les statistiques paramétriques réside dans le fait qu’elles soient basées ou non sur des modèles théoriques. Les statistiques non paramétriques étudient les variables qui ne correspondent pas aux distributions de probabilité, tandis que les statistiques paramétriques utilisent des distributions de probabilité définies.