Dans les mathématiques, une multitude de préceptes ont concouru à l’évolution de la compréhension de leur monde et leur environnement par les hommes. Certains sont devenus une évidence même pour les moins initiés. D’autres, même en étant avérés, ne trouvent encore aucune explication plausible jusqu’à aujourd’hui, et demeurent un mystère. Il en est ainsi de la loi de Benford, l’une des plus déconcertantes des lois mathématiques, mais aussi l’une des plus prometteuses en matière de sécurité liée à l’information.
En quoi consiste la loi de Benford ?
Cette loi édicte qu’en étude statistique, dans le cadre d’une observation de données numériques diversifiées, le premier chiffre significatif (non nul) le plus fréquent est le 1, avant le 2, avant le 3… avant le 9. Autrement dit, on a plus de chance de rencontrer le chiffre 1 que le suivant et ainsi de suite, dans les données chiffrées, ce, dans presque tous les domaines de la vie courante, en physique, en construction, en sciences, etc. Généralisée, la loi de Benford donne la formule : P(c) = Log10 (1+c/10) où P est la probabilité de rencontrer le chiffre « c », premier chiffre significatif à choisir parmi 1, 2, 3 …9, et Log10 indique le logarithme décimal. Cette loi est vérifiable dans une multitude de données statistiques comme la taille des villes dans un pays, le cours boursier, les longueurs des fleuves dans le monde, les données financières des entreprises, relevé bancaire, les statistiques de fréquentation d’un musée, etc. Il s’agit d’une loi empirique issue de nombreuses vérifications. Il s’agit alors d’une découverte étonnante du fait que, dans l’intuition des gens, mathématiciens ou profanes, l’on s’attend toujours que tous les chiffres aient une fréquence d’apparitions égale.
Histoire de la loi de Benford
Cette loi date de 1881, quand un astronome américain du nom de Simon Newcomb en décrit les préceptes dans un journal. Sa théorie s’est basée sur une observation : l’utilisation plus fréquente des pages contenant le chiffre 1 en premier dans les tables de logarithmes, au détriment de celles qui contenaient les autres chiffres en premier.
Mais son analyse est passée inaperçue, puis jetée aux oubliettes, jusqu’à la fameuse année 1938 où un ingénieur physicien américain du nom de Frank Benford, remarqua les mêmes taux d’usage inégaux des données logarithmiques. Ainsi, sachant que la première loi était méconnue, celle que Benford baptisa d’abord « loi des nombres anormaux » porte désormais son propre nom. Et en somme, les trouvailles des deux scientifiques donnaient la même formule.
Les applications de la loi de Benford
A ses débuts, la loi Benford est restée une curiosité même dans le cercle des mathématiciens et des statisticiens. Ce n’est que vers la fin des années 1980 que l’idée d’en faire usage est apparue aux États-Unis. D’emblée, il s’agissait d’une application dans le domaine économique. Par ailleurs, l’on indique certaines limites à l’utilisation de la loi de Benford, par exemple lorsque les données présentées sont peu considérables ou trop importantes, ou quand les données chiffrées utilisent des virgules. Aujourd’hui, la loi de Benford est utilisée dans une multitude de domaines et d’applications. Mais celles où elle s’impose le plus, c’est la détection des fraudes en tout genre. Ainsi, elle est utilisée pour détecter des fraudes fiscales et comptables, sachant que certains chiffres significatifs comme le 5 ou le 6 prédominent dans les données falsifiées, des fraudes électorales ou encore des données scientifiques erronées. Des scientifiques lui attribuent un potentiel énorme dans la détection des falsifications des données informatiques. En l’occurrence, quand des données numériques ne suivent pas la loi de Benford, elles seront considérées comme faussées. Mais encore une fois, il s’avère que certaines données sont compatibles avec la loi de Benford et d’autres ne le sont pas.
Loi Benford en résumé
En somme, la loi de Benford, c’est simplement le fait de rencontrer plus fréquemment le 1 que le 9 dans les informations chiffrées de la vie courante. Jusqu’à aujourd’hui, personne n’a encore trouvé de fondement logique dans l’établissement de la loi de Benford. D’aucuns se plaisent à dire qu’elle modélise la façon dont la pensée humaine répertorie les chiffres et les utilisent.
En tout cas, même s’il s’agit d’une curiosité mathématique qui semble plaire à nombreux statisticiens, économistes et Police antifraudes, la loi Benford est à manier avec précaution. Dans les faits, il peut être recommandé de l’utiliser à côté d’autres systèmes d’investigation. En outre, différents procédés de tests peuvent être utilisés pour jauger de son efficacité dans un domaine particulier.