Biais de sous-dénombrement : explication & Exemples
Le biais de sous-dénombrement est le biais qui se produit lorsque certains membres d’une population ne sont pas suffisamment représentés dans l’échantillon.
Ce type de biais se produit souvent dans l’échantillonnage de commodité et l’échantillonnage à réponse volontaire , dans lesquels vous collectez un échantillon facile à obtenir mais qui est souvent sujet au sous-dénombrement de certains membres d’une population.
Pourquoi le biais de sous-dénombrement est-il un problème ?
Le biais de sous-dénombrement est un problème car il fait que l’échantillon n’est pas représentatif de la population. L’objectif de la collecte de données pour un échantillon est d’obtenir des données d’une manière plus rapide et plus simple que la collecte de données pour une population entière, et de pouvoir extrapoler les résultats de l’échantillon à la population plus large.
Toutefois, afin d’extrapoler les résultats, l’échantillon doit être représentatif de notre population dans son ensemble. Idéalement, nous aimerions que notre échantillon soit une version « mini » de la population. Malheureusement, le biais de sous-dénombrement peut faire en sorte que les personnes de notre échantillon soient très différentes de celles de la population plus large.
Par exemple, supposons que les chercheurs souhaitent savoir ce que les citoyens d’une certaine ville pensent d’une nouvelle loi potentielle. Pour collecter des données, ils se rendent dans une bibliothèque voisine et demandent aux visiteurs ce qu’ils pensent de la nouvelle loi potentielle. Bien qu’il s’agisse d’un moyen pratique de collecter des données, les chercheurs risquent de sous-dénombrer plusieurs types de personnes, notamment :
- Les personnes confinées à la maison
- Les gens qui n’aiment tout simplement pas visiter la bibliothèque
- Les personnes qui fréquentent une autre bibliothèque dans une autre partie de la ville
Étant donné que cette étude exclut certains types de personnes, il est peu probable que les résultats de l’étude soient représentatifs de la population.
Par exemple, supposons que les personnes qui fréquentent cette bibliothèque particulière soient beaucoup plus susceptibles de soutenir la nouvelle loi potentielle que le reste de la population. Cela signifie que lorsque les résultats de l’enquête seront connus, il apparaîtra qu’un pourcentage élevé de citoyens de cette ville soutiennent la nouvelle loi potentielle, alors qu’en réalité la plupart des citoyens ne le font pas.
Le visuel ci-dessous illustre ce problème : supposons que les cercles verts représentent des personnes favorables à la nouvelle loi tandis que les cercles rouges représentent des personnes opposées à la nouvelle loi :
Remarquez que la plupart des personnes favorables à la nouvelle loi sont incluses dans l’échantillon, mais que celui-ci n’est pas représentatif de la population dans son ensemble. Les résultats de l’enquête montreraient que la plupart des gens sont favorables à la nouvelle loi, alors qu’en réalité ce n’est pas vrai.
Exemples de biais de sous-dénombrement
Les exemples suivants illustrent plusieurs cas dans lesquels un biais de sous-dénombrement peut survenir.
Exemple 1
Les chercheurs veulent savoir ce que les citoyens d’une certaine ville pensent de la construction d’un nouveau parc. Afin de collecter des données, les chercheurs assistent à une réunion municipale locale et interrogent les habitants sur leurs réflexions. Malheureusement, cette forme d’échantillonnage de commodité risque de souffrir du sous-dénombrement des groupes suivants :
- Les personnes qui n’ont pas accès aux transports pour se rendre aux assemblées municipales
- Des gens qui ne savent même pas que des assemblées municipales ont lieu
- Les gens qui travaillent le soir et ne peuvent tout simplement pas assister aux réunions municipales
Ainsi, les opinions de ces personnes ne seront pas prises en compte dans les résultats de l’étude. En raison du sous-dénombrement de ces groupes spécifiques, il est peu probable que l’échantillon soit représentatif de la population dans son ensemble.
Exemple 2
Les chercheurs veulent savoir combien d’heures par jour les gens regardent la télévision dans un pays donné. Pour collecter des données pour l’étude, ils choisissent au hasard des noms dans un répertoire téléphonique local et appellent les gens pour les interroger sur leur consommation de télévision. Il s’agit d’une forme d’échantillonnage de commodité qui risque de souffrir du sous-dénombrement des groupes suivants :
- Des personnes très riches qui n’inscrivent pas leur numéro de téléphone dans les annuaires téléphoniques locaux
- Des jeunes qui utilisent uniquement des téléphones portables et dont les numéros ne figurent pas dans les annuaires téléphoniques locaux
Ainsi, la quantité de télévision que regardent les personnes très riches et les jeunes sera sous-estimée dans cette étude. En raison du sous-dénombrement de ces groupes spécifiques, il est peu probable que l’échantillon soit représentatif de la population dans son ensemble.
Exemple 3
Les chercheurs veulent savoir ce que les citoyens d’une ville particulière pensent d’un nouveau code de la route. Ils distribuent donc un questionnaire aux personnes qui passent dans un centre commercial local. Il s’agit d’une forme d’échantillonnage de commodité qui risque de souffrir d’une sous-dénombrement des groupes suivants :
- Les personnes qui n’ont pas accès aux transports pour se rendre au centre commercial (et ne sont donc largement pas concernées par le code de la route)
- Les personnes qui n’aiment pas aller au centre commercial (et peuvent donc choisir de ne pas conduire dans les zones très fréquentées)
- Les gens qui vont dans un autre centre commercial dans une autre ville
Ainsi, les opinions de ces personnes ne seront pas prises en compte dans les résultats de l’étude. En raison du sous-dénombrement de ces groupes spécifiques, il est peu probable que l’échantillon soit représentatif de la population dans son ensemble.
Comment prévenir les biais de sous-dénombrement
Le biais de sous-dénombrement résulte souvent d’un échantillonnage de commodité. Pour éliminer (ou du moins minimiser) les effets du biais de sous-dénombrement, une meilleure forme d’échantillonnage consiste à utiliser un échantillon aléatoire simple .
Dans ce type d’échantillon, chaque membre d’une population a une chance égale d’être sélectionné pour faire partie de l’échantillon.
L’avantage de cette approche est que les échantillons aléatoires simples sont généralement représentatifs de la population qui nous intéresse puisque chaque membre a une chance égale d’être inclus dans l’échantillon.
Lorsque nous utilisons cette approche au lieu de l’échantillonnage de commodité, nous pouvons être plus confiants dans notre capacité à extrapoler les résultats de l’échantillon à la population plus large, car il est probable que des membres de chaque (ou presque) groupe de la population soient inclus dans l’échantillon. .
Ressources additionnelles
Qu’est-ce que le biais d’auto-sélection ?
Qu’est-ce que le biais de référencement ?
Qu’est-ce que le biais de non-réponse ?