5 exemples de valeurs aberrantes dans la vie réelle
Une valeur aberrante est un point de données anormalement éloigné des autres valeurs d’un ensemble de données.
Nous définissons souvent un point de données comme une valeur aberrante s’il est 1,5 fois l’intervalle interquartile supérieur au troisième quartile ou 1,5 fois l’intervalle interquartile inférieur au premier quartile d’un ensemble de données.
Remarque : L’intervalle interquartile est la différence entre le troisième quartile (75e centile) et le premier quartile (25e centile) d’un ensemble de données.
Les scénarios suivants présentent des exemples de valeurs aberrantes dans des situations réelles.
Exemple 1 : Valeurs aberrantes en matière de revenu
Un scénario concret dans lequel des valeurs aberrantes apparaissent souvent est celui de la répartition des revenus.
Par exemple, le 25e centile (Q1) du revenu annuel dans un certain pays peut être de 15 000 $ par an et le 75e centile (Q3) peut être de 120 000 $ par an.
L’écart interquartile (IQR) serait calculé comme suit : 120 000 $ – 15 000 $ = 105 000 $.
Cela signifie que toute personne dont le revenu se situe en dehors des limites suivantes serait considérée comme une valeur aberrante :
- Limite inférieure : Q1 – 1,5*IQR = 15 000 $ – 1,5*105 000 $ = -142 500 $
- Limite supérieure : Q3 + 1,5*IQR = 120 000 $ + 1,5*105 000 $ = 277 500 $
Quelqu’un comme Elon Musk, dont la valeur nette se chiffre en milliards de dollars, serait considéré comme une valeur aberrante en termes de revenu annuel.
Remarque : La valeur des valeurs aberrantes au-delà de la limite inférieure n’a pas toujours de sens, par exemple, il n’est pas possible de gagner un revenu annuel négatif.
Exemple 2 : valeurs aberrantes en matière d’apnée
Un autre scénario du monde réel dans lequel des valeurs aberrantes apparaissent souvent est celui de l’apnée.
Par exemple, le 25e centile (Q1) concernant la durée pendant laquelle les individus peuvent retenir leur souffle est d’environ 15 secondes, tandis que le 75e centile (Q3) est d’environ 75 secondes.
L’intervalle interquartile (IQR) serait calculé comme suit : 75 – 15 = 60.
Cela signifie que toute personne capable de retenir sa respiration en dehors des limites suivantes serait considérée comme une valeur aberrante :
- Limite inférieure : Q1 – 1,5*IQR = 15 – 1,5*60 = -75 secondes
- Limite supérieure : Q3 + 1,5*IQR = 75 + 1,5*60 = 165 secondes
Tous les apnéistes capables de retenir leur souffle pendant 10 minutes ou plus seraient considérés comme des valeurs aberrantes car ils peuvent retenir leur souffle bien plus longtemps que 165 secondes.
Exemple 3 : Valeurs aberrantes dans la taille des animaux
Un autre scénario du monde réel dans lequel des valeurs aberrantes apparaissent souvent est la taille des animaux.
Par exemple, le 25e centile (Q1) de la taille du cheval est d’environ 5 pieds et le 75e centile (Q3) est d’environ 5,5 pieds.
L’intervalle interquartile (IQR) serait calculé comme suit : 5,5 – 5 = 0,5 pied.
Cela signifie que tout cheval dont la taille se situe en dehors des limites suivantes serait considéré comme une valeur aberrante :
- Limite inférieure : Q1 – 1,5*IQR = 5 – 1,5*0,5 = 4,25 pieds
- Limite supérieure : Q3 + 1,5*IQR = 5 + 1,5*0,5 = 5,75 pieds
Selon le Guinness World Records , le record du cheval le plus grand de tous les temps se situe juste au-dessus de 7 pieds. Comme c’est au-dessus de la limite supérieure de 5,75 pieds, ce cheval serait clairement considéré comme une valeur aberrante.
Exemple 4 : Valeurs aberrantes dans les ventes de billets de cinéma
Un autre scénario concret dans lequel des valeurs aberrantes apparaissent souvent est celui de la vente de billets de cinéma.
Par exemple, le 25e centile (T1) des ventes brutes de billets de cinéma est d’environ 2 millions de dollars et le 75e centile (T3) est d’environ 15 millions de dollars.
L’écart interquartile (IQR) serait calculé comme suit : 15 millions de dollars – 2 millions de dollars = 13 millions de dollars.
Cela signifie que tout film dont les ventes brutes se situent en dehors des limites suivantes serait considéré comme une valeur aberrante :
- Limite inférieure : T1 – 1,5*IQR = 2 millions de dollars – 1,5*13 millions de dollars = -17,5 millions de dollars
- Limite supérieure : T3 + 1,5*IQR = 15 millions de dollars + 1,5*13 millions de dollars = 34,5 millions de dollars
La plupart des films Star Wars ont rapporté bien plus de 34,5 millions de dollars, ce qui en fait des valeurs aberrantes en termes de vente de billets.
Exemple 5 : Valeurs aberrantes dans les points marqués par match
Un autre domaine du monde réel dans lequel des valeurs aberrantes apparaissent souvent est celui du sport professionnel.
Par exemple, le 25e percentile (Q1) des points marqués par les joueurs NBA est d’environ 5 points par match et le 75e percentile (Q3) est d’environ 15 points par match.
L’écart interquartile (IQR) serait calculé comme suit : 15 – 5 = 10 points.
Cela signifie que tout joueur dont la moyenne se situe en dehors des limites suivantes serait considéré comme une valeur aberrante :
- Limite inférieure : Q1 – 1,5*IQR = 5 – 1,5*10 = -10 points
- Limite supérieure : Q3 + 1,5*IQR = 15 + 1,5*10 = 30 points
Au cours de nombreuses saisons de la NBA , le joueur le plus performant marque généralement un peu plus de 30 points par match, ce qui en fait une valeur aberrante.
Ressources additionnelles
Les didacticiels suivants expliquent comment rechercher des valeurs aberrantes dans des ensembles de données à l’aide de divers logiciels statistiques :
Comment trouver les valeurs aberrantes dans Excel
Comment trouver les valeurs aberrantes dans R
Comment trouver les valeurs aberrantes en Python
Comment trouver les valeurs aberrantes dans SPSS