IC para la media: x̄ ± z·(σ/√n) para σ conocida; t para muestras pequeñas.
IC = x̄ ± crítico × (s/√n). La regla automática elige z cuando n ≥ 30 (muestra grande, CLT) y t de Student con gl = n−1 en caso contrario. El intervalo del 95 % contiene la media real en ~95 % de las muestras repetidas; NO es una declaración de probabilidad sobre un único parámetro fijo.
La media muestral es una estimación puntual — un solo número extraído de una muestra particular. Si se repite la encuesta, el ensayo o el lote de producción, casi con toda seguridad se obtendrá un número diferente. El propósito de la estadística inferencial es cuantificar hasta dónde puede llevar plausiblemente esa variación, y un intervalo de confianza (IC) es la herramienta que lo logra. En lugar de decir a su lector "la satisfacción media es de 7,4 sobre 10" — lo que suena preciso pero es silenciosamente incorrecto sobre su propia precisión — un IC dice "la satisfacción media es de 7,4, y la verdadera media poblacional casi con toda seguridad se encuentra entre 6,8 y 8,0". Esa segunda frase es la que necesitan los responsables de la toma de decisiones: les indica si la diferencia entre dos productos, dos cohortes o dos lotes es probablemente real o ruido.
Los IC se adaptan elegantemente a cada cambio que realice. ¿Muestra más grande? El intervalo se reduce. ¿Mayor variabilidad en los datos subyacentes? Se ensancha. ¿Se requiere mayor confianza? Se ensancha de nuevo. Un regulador que exija una certeza del 99,9 % antes de aprobar un medicamento obtendrá un intervalo más amplio — y necesitará un ensayo mucho mayor — que un comercializador satisfecho con el 90 %. Las matemáticas hacen explícita la compensación.
El intervalo es también el vocabulario adecuado para hablar con no estadísticos. La gente entiende "entre 6,8 y 8,0" instintivamente; hay que enseñarles a leer los valores p. Esa legibilidad es la razón por la que cada revista científica creíble, cada informe de auditoría y cada panel de control de pruebas A/B ahora informa los IC junto con (o en lugar de) las pruebas de hipótesis.
Para la media de una variable cuantitativa, el intervalo de confianza bilateral es:
CI = x̄ ± crítico × (s / √n)
donde x̄ es la media muestral, s la desviación estándar muestral, n el tamaño de la muestra, y crítico un multiplicador leído de una tabla de probabilidades.
Dos distribuciones proporcionan el multiplicador:
La cantidad s / √n es el error estándar de la media — la desviación estándar de x̄ a través de muestras repetidas hipotéticas. Multiplicarlo por el valor crítico lo escala al nivel de confianza que haya elegido.
STDEV.S(...) o =STDEV(...).auto a menos que tenga una razón específica para anularla. auto selecciona z cuando n ≥ 30 y t con gl = n − 1 por debajo de ese umbral. Force z solo cuando σ sea genuinamente conocida a priori (raro). Force t para ser conservador en muestras pequeñas incluso más allá del umbral de 30.El panel de resultados muestra los límites inferior y superior, el margen de error, el valor crítico utilizado, el error estándar y qué distribución realizó el trabajo.
Un ensayo clínico mide el tiempo de recuperación en 15 pacientes, encuentra una media de 7,4 días con una desviación estándar muestral de 1,2 días, y desea un IC del 95 %.
Ahora suponga que los mismos números provienen de un ensayo mucho mayor de n = 1.000 pacientes. El error estándar baja a 1,2 / √1.000 = 0,0379, la calculadora cambia a z (n ≥ 30), crítico = 1,96, margen = 0,074. IC = [7,33, 7,47]. Misma estimación puntual, un intervalo diez veces más ajustado — el tamaño de la muestra compra precisión.
Un IC del 95 % no es "una probabilidad del 95 % de que la media poblacional esté en este intervalo". La interpretación frecuentista es "si repitiéramos el proceso de muestreo indefinidamente, el 95 % de los intervalos que construyéramos contendrían la verdadera media". El parámetro es fijo; el intervalo es aleatorio. Las personas que desean la afirmación de probabilidad necesitan un intervalo creíble bayesiano en su lugar.
Un IC estrecho no es lo mismo que uno preciso. Si su método de muestreo está sesgado — muestras de conveniencia, encuestados auto-seleccionados, abandonos — el IC será ajustado pero centrado en el número incorrecto. La estadística cuantifica el error de muestreo, no el error de medición o el sesgo de selección. Una encuesta en línea de un millón de encuestados aún puede estar muy desviada si los encuestados no se parecen a la población.
Los IC asumen que los datos provienen de una distribución aproximadamente simétrica (o que n es lo suficientemente grande para que el TLC se active). Los datos muy asimétricos — ingresos, tiempos de respuesta, intensidades de reacciones biológicas — deben transformarse (log) antes de aplicar la fórmula, o analizarse con un método no paramétrico como un IC bootstrap.
Un IC para la media no es un intervalo de predicción para una observación individual. El IC le dice dónde reside la media; el intervalo de predicción (mucho más amplio, un factor de ≈ √(1 + 1/n) mayor) le dice dónde es probable que caiga el siguiente valor individual.
Si calcula muchos IC simultáneamente — comparando 20 variantes de productos, examinando 100 genes — la tasa de error familiar se dispara. Las correcciones de Bonferroni o Benjamini-Hochberg ensanchan cada intervalo para mantener la honestidad del nivel de confianza general.
Finalmente, un IC no dice nada sobre la significación clínica o empresarial. Una mejora perfectamente significativa de 0,1 puntos en la satisfacción del usuario puede ser estadísticamente real y económicamente irrelevante. Lea siempre los límites en unidades de dominio antes de actuar sobre ellos.
Elegir el intervalo correcto es la mitad del análisis. Aplicar erróneamente un IC de la media cuando se necesitaba un IC de una proporción o un intervalo de predicción es uno de los errores más comunes en la estadística aplicada — y uno de los más fáciles de evitar una vez que las distinciones anteriores están claras.