Comment winsoriser les données dans Excel
Winsoriser les données signifie définir des valeurs aberrantes extrêmes égales à un centile spécifié des données.
Par exemple, une winsorisation de 90 % définit toutes les observations supérieures au 95e centile égales à la valeur au 95e centile et toutes les observations inférieures au 5e centile égales à la valeur au 5e centile.
Ce didacticiel fournit un exemple étape par étape de la façon de winsoriser un ensemble de données dans Excel.
Étape 1 : Créer les données
Tout d’abord, nous allons créer l’ensemble de données suivant :
Étape 2 : Calculer les percentiles supérieur et inférieur
Pour cet exemple, nous effectuerons une winsorisation à 90 %. Cela signifie que nous définirons toutes les valeurs supérieures au 95e centile égales au 95e centile et toutes les valeurs inférieures au 5e centile égales au 5e centile.
Les formules suivantes montrent comment trouver les 5e et 95e centiles :
Le 5ème centile s’avère être 12,35 et le 95ème centile s’avère être 92,05 .
Étape 3 : Winsoriser les données
Enfin, nous utiliserons la formule suivante pour winsoriser les données :
Notez que nous copions et collons simplement la formule de la cellule F2 dans les cellules restantes de la colonne F.
Dans ce cas, la valeur 3 est devenue 12,35 et la valeur 98 est devenue 92,05 .
Notez que dans cet exemple, nous avons effectué une winsorisation à 90 %, mais il est possible d’effectuer également une winsorisation à 80 %, une winsorisation à 95 %, une winsorisation à 99 %, etc. en calculant simplement différents centiles supérieurs et inférieurs.