Loi de Benford
Cet article explique en quoi consiste la loi de Benford. De plus, vous pourrez voir comment la loi de Benford a été découverte et quelles sont les applications de cette loi statistique.
Qu’est-ce que la loi de Benford ?
La loi de Benford , également appelée loi du premier chiffre , est une loi statistique qui dit que la probabilité que le premier chiffre d’une donnée soit 1 est supérieure à la probabilité qu’il s’agisse d’un autre nombre.
Autrement dit, la loi de Benford dit que dans un ensemble de données numériques existant dans la vie réelle, le nombre 1 est le nombre le plus répété comme premier chiffre des données.
De plus, plus le nombre est élevé, moins il est probable qu’il se retrouve en première position. Par conséquent, le premier chiffre est plus probablement un 1 qu’un 2, mais 2 est plus probable que 3, 3 est plus probable que 4, et ainsi de suite.
La loi de Benford doit son nom à l’Américain Frank Benford. Bien qu’il ne l’ait pas inventé, Benford a popularisé cette règle statistique. Nous verrons ci-dessous l’origine de la loi de Benford.
Formule de la loi de Benford
La loi de Benford stipule que la probabilité que le premier chiffre soit un certain nombre est égale au logarithme de un plus un sur ce nombre.
La formule de la loi de Benford est donc la suivante :
Par conséquent, à partir de la formule de la loi de Benford, nous pouvons déduire la probabilité pour chaque nombre qu’il s’agisse du premier chiffre d’une donnée. Dans le tableau suivant, vous pouvez voir les pourcentages de toutes les probabilités :
Chiffre | Probabilité que être le premier numéro |
---|---|
1 | 30,1% |
2 | 17,6% |
3 | 12,5% |
4 | 9,7% |
5 | 7,9% |
6 | 6,7% |
7 | 5,8% |
8 | 5,1% |
9 | 4,6% |
De plus, ci-dessous, vous pouvez voir un histogramme dans lequel toutes les probabilités de la loi de Benford sont représentées graphiquement :
Histoire de la loi de Benford
En 1881, le mathématicien Simon Newcomb déduit la loi de Benford lorsqu’il découvre que les premières pages des tableaux de logarithmes sont considérablement plus utilisées que les dernières pages. Ce qui signifiait que les premiers chiffres des nombres ne sont pas équiprobables, mais que 1 était plus fréquent que 2, 2 plus fréquent que 3, et ainsi de suite jusqu’à 9.
Cependant, Newcomb n’a laissé aucune preuve statistique que cette règle était respectée, il a simplement fait une déduction à partir de l’usure des tables logarithmiques.
Plus tard, plus précisément en 1938, le physicien Frank Benford fit la même observation et réalisa également une expérience pour la vérifier empiriquement. Sur un ensemble de données statistiques de 20 229 valeurs provenant de 20 échantillons différents, il a réalisé une étude sur le premier chiffre de chaque donnée. Ainsi, sur la base des résultats, il a démontré que la loi de Benford était remplie et en a déduit la formule qui lui a permis de calculer la probabilité que le premier chiffre soit un certain nombre (nous avons vu cette formule ci-dessus).
En bref, bien que la loi de Benford ait été découverte pour la première fois par Simon Newcomb, elle porte le nom de Frank Benford car c’est lui qui a vérifié cette loi statistique.
Applications de la loi de Benford
La loi de Benford est une loi statistique qui trouve des applications dans des domaines très différents. Par exemple, la loi de Benford est largement utilisée en économie, en biologie et même en politique.
En économie, la loi de Benford est souvent utilisée pour détecter la manipulation de données, car si un ensemble de données n’est pas conforme à la loi de Benford, cela indique que les données ont été manipulées. Cette loi est par exemple utilisée pour détecter d’éventuels cas de fraude fiscale.
Il convient de noter que la loi de Benford ne sert pas à démontrer la véracité des phénomènes aléatoires, puisque les résultats sont équiprobables. Ainsi, la règle de Benford ne peut pas être utilisée pour vérifier les résultats de loterie.
D’un autre côté, en génétique, la loi de Benford peut être utilisée pour analyser les différences de longueur du génome entre différents types d’organismes.
Enfin, des tentatives ont également été faites pour détecter la fraude électorale en appliquant la loi de Benford, même si son utilité dans ce cas a été remise en question.