Théorème central limite
Théorème central limite, en théorie des probabilités, un théorème qui établit la distribution normale comme la distribution vers laquelle converge rapidement la moyenne (la moyenne) de presque tout ensemble de variables indépendantes et générées aléatoirement. Le théorème central limite explique pourquoi la distribution normale se présente si couramment et pourquoi elle est généralement une excellente approximation pour la moyenne d’une collection de données (souvent avec aussi peu que 10 variables).
La version standard du théorème de la limite centrale, prouvée pour la première fois par le mathématicien français Pierre-Simon Laplace en 1810, stipule que la somme ou la moyenne d’une séquence infinie de variables aléatoires indépendantes et identiquement distribuées, lorsqu’elle est convenablement remise à l’échelle, tend vers une distribution normale. Quatorze ans plus tard, le mathématicien français Siméon-Denis Poisson a entamé un processus continu d’amélioration et de généralisation. Laplace et ses contemporains s’intéressaient au théorème principalement en raison de son importance dans les mesures répétées d’une même quantité. Si les mesures individuelles pouvaient être considérées comme approximativement indépendantes et identiquement distribuées, alors leur moyenne pouvait être approximée par une distribution normale.
Le mathématicien belge Adolphe Quetelet (1796-1874), célèbre aujourd’hui comme l’initiateur du concept de l’homme moyen (« average man »), a été le premier à utiliser la distribution normale pour autre chose que l’analyse des erreurs. Par exemple, il a recueilli des données sur le tour de poitrine des soldats (voir figure) et a montré que la distribution des valeurs enregistrées correspondait approximativement à la distribution normale. De tels exemples sont aujourd’hui considérés comme des conséquences du théorème de la limite centrale.
Le théorème de la limite centrale joue également un rôle important dans le contrôle de qualité industriel moderne. La première étape pour améliorer la qualité d’un produit consiste souvent à identifier les principaux facteurs qui contribuent aux variations indésirables. Des efforts sont ensuite déployés pour contrôler ces facteurs. Si ces efforts sont couronnés de succès, toute variation résiduelle sera généralement causée par un grand nombre de facteurs, agissant de manière à peu près indépendante. En d’autres termes, les petites quantités de variation restantes peuvent être décrites par le théorème de la limite centrale, et la variation restante se rapprochera généralement d’une distribution normale. Pour cette raison, la distribution normale est la base de nombreuses procédures clés du contrôle statistique de la qualité.