Les lois des probabilités ont, depuis de nombreux siècles, régi l’étude d’une bonne liste de phénomènes observés dans divers domaines, allant des jeux de hasard à la médecine ou à la météorologie, en passant par l’économie, et tant d’autres. Parmi la longue liste de lois de probabilités qui façonne aujourd’hui les activités statistiques, l’on retrouve la loi hypergéométrique. Que cache ce terme intimidant ? Quel est son intérêt ?
La loi hypergéométrique : de quoi s’agit-il ?
La loi hypergéométrique est une solution de probabilité basée sur une combinatoire que l’on a l’habitude de rencontrer dans de nombreux contextes. Elle fait partie du grand groupe des lois de probabilités discrètes, lesquelles décrivent la probabilité d’apparition de chaque valeur d’une variable aléatoire discrète (c’est-à-dire une variable aléatoire pouvant prendre des valeurs dénombrables, comme des nombres entiers non négatifs par exemple).
Autrement dit, la loi discrète modélise le comportement aléatoire d’un phénomène dû au hasard. Et plus simplement, la loi hypergéométrique, elle, constitue une formule dont le résultat est la probabilité de tirer certaines pièces d’un tirage, au sein d’un tirage en plus grand nombre. Elle opère un tirage sans remise. Dans la pratique, elle touche un parterre d’étude quantitative de données, mais il faut bien en comprendre l’énoncé.
La formulation de la loi hypergéométrique
Même si le nom de cette loi de probabilité est assez impressionnant, et semble indiquer un terme de mathématicien expert, son approche est parmi les plus simples des formules de probabilités.
Considérons un lot de N pièces constitué de deux sous-ensembles : d’une part, des pièces présentant « telle caractéristique » dans telle proportion p, au nombre de Np, et d’autre part des pièces qui n’ont pas « telle caractéristique », dans une proportion 1-p = q (au nombre de Nq). Si l’on tire dans ce lot un échantillon aléatoire de n pièces, et que cet échantillon est extrait sans remise. Et si l’on considère le nombre de pièces de « telle caractéristique » dans ce lot, c’est que celui-ci est conforme à la loi hypergéométrique de paramètres N, n, p.
Par exemple, il s’agit d’obtenir 2 bonnes boules dans le tirage simultané ou successif de 4 pièces d’un lot de 30 boules, ou encore d’extraire 3 As sur 6 cartes, dans un jeu de 32 cartes… Autrement dit, l’on mise aussi bien sur la chance de trouver les bonnes pièces, que sur la malchance de ne pas en trouver. Pour qu’elle fonctionne, la loi hypergéométrique comprend divers paramètres à tenir compte.
Les conditions de la loi hypergéométrique, similarité avec la loi binomiale
La loi hypergéométrique est parfois considérée comme semblable à ce qu’on appelle la loi binomiale. Celle-ci édicte la probabilité d’une expérience de N occurrences d’un tirage à deux choix (deux valeurs opposées). L’espérance, la valeur que l’on espère trouver en moyenne en fonction de la répétition du tirage, et la variance, c’est-à-dire la possibilité pour une variable aléatoire discrète de prendre une valeur éloignée ou non de son espérance, sont les mêmes pour le cas hypergéométrique et binomial. La différence réside dans le fait que le tirage est avec remise, c’est-à-dire que les mêmes pièces peuvent être tirées une seconde fois. Le champ d’application de la loi hypergéométrique se résume donc comme suit : le tirage de l’échantillon est exhaustif et sans remise, qu’il soit successif ou simultané.
Utilités de la loi hypergéométrique
Comme tout autre procédé de calcul de probabilité, la loi hypergéométrique trouve son application dans de nombreux travaux statistiques et de calcul quantitative. Cette formule est utile dans le domaine des finances pour étudier les graphiques et l’évolution des cours boursiers. Elle est souvent utilisée dans le cadre des jeux de hasard ou des jeux où les statistiques sont un enjeu crucial, à ne citer que l’étude des probables résultats des matchs de foot ou de basketball, l’issue d’une course de chevaux ou d’une compétition de Formule 1. Mais la loi hypergéométrique trouve également tout son intérêt dans les études médicales, par exemple, pour déterminer la pertinence d’un diagnostic et de l’administration de soins spécifiques, pour évaluer le taux de personnes hypertendues dans une zone géographique donnée, etc. Les études climatiques sont aussi des terrains d’application intéressants de la loi hypergéométrique. Plus spécialement, elle sert à certains spécialistes en communication à relever et répertorier des messages informatifs et des données multilingues dans les réseaux sociaux (les tweets par exemple) En somme, autant que les autres lois de probabilité, la loi hypergéométrique est une solution mathématique à multiples tranchants, mais dont la maîtrise nécessite quelques apprentissages, mais surtout de la patience.