IC de la moyenne : x̄ ± z·(σ/√n) σ connu; t pour petits échantillons.
IC = x̄ ± critique × (s/√n). La règle auto choisit z quand n ≥ 30 (grand échantillon, TCL) et la loi de Student t avec dl = n−1 sinon. L'intervalle à 95 % contient la vraie moyenne dans ~95 % des échantillons répétés — ce n'est PAS une déclaration de probabilité sur un paramètre fixe unique.
Une moyenne d'échantillon est une estimation ponctuelle — un nombre unique tiré d'un échantillon particulier. Si vous relancez l'enquête, l'essai ou le lot de production, vous obtiendrez presque certainement un nombre différent. L'objectif des statistiques inférentielles est de quantifier l'étendue plausible de cette variation, et un intervalle de confiance (IC) est l'outil qui le permet. Au lieu de dire à votre lecteur "la satisfaction moyenne est de 7,4 sur 10" — ce qui semble précis mais est implicitement erroné quant à sa propre précision — un IC dit "la satisfaction moyenne est de 7,4, et la vraie moyenne de la population se situe presque certainement entre 6,8 et 8,0". Cette seconde phrase est celle dont les décideurs ont besoin : elle leur indique si la différence entre deux produits, deux cohortes ou deux lots est probablement réelle ou probablement du bruit.
Les IC s'adaptent harmonieusement à tout ce que vous modifiez. Échantillon plus grand ? L'intervalle se réduit. Plus de variabilité dans les données sous-jacentes ? Il s'élargit. Confiance plus élevée requise ? Il s'élargit de nouveau. Un régulateur exigeant 99,9 % de certitude avant d'approuver un médicament obtiendra un intervalle plus large — et aura besoin d'un essai beaucoup plus grand — qu'un marketeur satisfait de 90 %. Les calculs rendent le compromis explicite.
L'intervalle est également le bon vocabulaire pour parler aux non-statisticiens. Les gens comprennent instinctivement "entre 6,8 et 8,0" ; ils doivent être formés pour lire les valeurs p. Cette lisibilité est la raison pour laquelle chaque revue scientifique crédible, chaque rapport d'audit et chaque tableau de bord de tests A/B rapporte désormais les IC parallèlement (ou à la place) des tests d'hypothèses.
Pour la moyenne d'une variable quantitative, l'intervalle de confiance bilatéral est :
IC = x̄ ± critical × (s / √n)
où x̄ est la moyenne de l'échantillon, s l'écart type de l'échantillon, n la taille de l'échantillon, et critical un multiplicateur lu dans une table de probabilités.
Deux distributions fournissent le multiplicateur :
La quantité s / √n est l'erreur standard de la moyenne — l'écart type de x̄ sur des échantillons répétés hypothétiques. La multiplier par la valeur critique l'ajuste au niveau de confiance que vous avez choisi.
STDEV.S(...) ou =STDEV(...).auto sauf si vous avez une raison spécifique de la modifier. auto choisit z lorsque n ≥ 30 et t avec df = n − 1 en dessous de ce seuil. Forcez z uniquement lorsque σ est réellement connu a priori (rare). Forcez t pour être conservateur sur de petits échantillons, même au-delà du seuil de 30.Le panneau de résultats affiche les bornes inférieure et supérieure, la marge d'erreur, la valeur critique utilisée, l'erreur standard, et quelle distribution a été utilisée.
Un essai clinique mesure le temps de récupération sur 15 patients, trouve une moyenne de 7,4 jours avec un écart type d'échantillon de 1,2 jours, et souhaite un IC de 95 %.
Supposons maintenant que les mêmes chiffres proviennent d'un essai beaucoup plus grand de n = 1 000 patients. L'erreur standard tombe à 1,2 / √1 000 = 0,0379, le calculateur passe à z (n ≥ 30), critique = 1,96, marge = 0,074. IC = [7,33, 7,47]. Même estimation ponctuelle, un intervalle dix fois plus serré — la taille de l'échantillon permet d'obtenir de la précision.
Un IC de 95 % n'est pas "une probabilité de 95 % que la moyenne de la population se trouve dans cet intervalle". L'interprétation fréquentiste est "si nous répétions le processus d'échantillonnage indéfiniment, 95 % des intervalles que nous construirions contiendraient la vraie moyenne". Le paramètre est fixe ; l'intervalle est aléatoire. Les personnes qui souhaitent une déclaration de probabilité ont plutôt besoin d'un intervalle crédible bayésien.
Un IC étroit n'est pas synonyme d'exactitude. Si votre méthode d'échantillonnage est biaisée — échantillons de commodité, répondants auto-sélectionnés, abandons — l'IC sera étroit mais centré sur le mauvais chiffre. Les statistiques quantifient l'erreur d'échantillonnage, pas l'erreur de mesure ou le biais de sélection. Un sondage en ligne auprès d'un million de répondants peut toujours être complètement faux si les répondants ne ressemblent pas à la population.
Les IC supposent que les données proviennent d'une distribution à peu près symétrique (ou que n est suffisamment grand pour que le Théorème Central Limite s'applique). Les données fortement asymétriques — revenus, temps de réponse, forces de réaction biologiques — doivent être transformées (log) avant d'appliquer la formule, ou analysées avec une méthode non paramétrique comme un IC bootstrap.
Un IC pour la moyenne n'est pas un intervalle de prédiction pour une observation individuelle. L'IC vous dit où se situe la moyenne ; l'intervalle de prédiction (beaucoup plus large, facteur d'environ ≈ √(1 + 1/n) plus grand) vous dit où la prochaine valeur individuelle est susceptible de tomber.
Si vous calculez de nombreux IC simultanément — en comparant 20 variantes de produits, en criblant 100 gènes — le taux d'erreur par famille explose. Les corrections de Bonferroni ou de Benjamini-Hochberg élargissent chaque intervalle pour maintenir le niveau de confiance global honnête.
Enfin, un IC ne dit rien sur la signification clinique ou commerciale. Une amélioration parfaitement significative de 0,1 point de la satisfaction utilisateur peut être statistiquement réelle et économiquement non pertinente. Lisez toujours les bornes dans les unités du domaine avant d'agir en conséquence.
Choisir le bon intervalle représente la moitié de l'analyse. Appliquer à tort un IC de moyenne là où un IC de proportion ou un intervalle de prédiction était nécessaire est l'une des erreurs les plus courantes en statistique appliquée — et l'une des plus faciles à éviter une fois les distinctions ci-dessus claires.