Calculadora de puntuación Z

03Cómo funciona

Por qué este cálculo

La puntuación z es la estandarización más utilizada en estadística: transforma una observación en un número de desviaciones estándar respecto a la media de la población, permitiendo la comparación directa entre distribuciones con diferentes unidades. Una nota de 78 en una clase y 85 en otra no son comparables hasta que se conoce la media y la dispersión de la clase; sus puntuaciones z sí lo son. Una puntuación z también se conecta directamente con la distribución normal estándar: el 95 % de las observaciones caen dentro de ±1,96 σ; ±3 σ marca la regla del 99,7 %. El control de calidad Six Sigma, las puntuaciones de CI, las tablas de crecimiento (altura/peso pediátrico), las pruebas psicométricas y la mayoría de las pruebas A/B se basan en la aritmética de la puntuación z. Esta calculadora calcula la puntuación z a partir de x, μ y σ, además del percentil, las probabilidades de una cola y el valor p de dos colas, con una visualización de la curva normal que sombrea el área por debajo de la observación.

La fórmula

Puntuación Z: z = (x − μ) / σ.

x es la observación, μ la media, σ la desviación estándar (debe ser > 0). z es adimensional.

Función de distribución acumulada (CDF) de la normal estándar Φ(z): probabilidad de que una variable aleatoria normal estándar sea ≤ z. Calculada mediante la aproximación erf (Abramowitz & Stegun): erf(x) = 1 − (a₁t + a₂t² + a₃t³ + a₄t⁴ + a₅t⁵) e^(−x²), donde t = 1 / (1 + p·x), con constantes p = 0,3275911 y aᵢ según lo dado. Φ(z) = ½(1 + erf(z / √2)). Precisión hasta 1,5 × 10⁻⁷.

Salidas: - z: valor estandarizado. - Percentil: Φ(z) × 100, el porcentaje de la población con valores ≤ x. - P(X ≤ x): lo mismo que el percentil / 100. - P(X > x): 1 − Φ(z). - Valor p de dos colas: 2 × min(Φ(z), 1 − Φ(z)) — la probabilidad de observar |z| o mayor por casualidad, útil para pruebas de hipótesis.

Bandas de interpretación: |z| < 0,5 muy típico; 0,5–1 típico; 1–2 notable; 2–3 inusual; > 3 extremo.

Cómo usarlo

Introduzca la observación x, la media de la población μ y la desviación estándar σ. El panel de resultados muestra z (encabezado), percentil, valor p de dos colas, ambas probabilidades de una cola y una interpretación verbal. El gráfico dibuja la curva normal estándar, sombrea el área por debajo de z y marca la posición de z con una línea vertical.

Ejemplo resuelto

Puntuación CI 120, μ = 100, σ = 15 (escala CI estándar).

z = (120 − 100) / 15 = +1,333.
Φ(z) = 0,9088 → percentil 90,88.
P(X ≤ 120) = 90,88 %; P(X > 120) = 9,12 %.
Valor p de dos colas: 2 × 9,12 % = 18,24 %.
Interpretación: Notable (1 < |z| < 2).

Nota de examen 78, μ = 70, σ = 10.

z = +0,8.
Φ(0,8) = 0,7881 → percentil 78,81.

Valor atípico: 245, μ = 100, σ = 25.

z = (245 − 100) / 25 = +5,8.
Φ(5,8) ≈ 1 (precisión del ordenador); P(X > 5,8 σ) ≈ 3,3 × 10⁻⁹.
Interpretación: Extremo — un evento de esta magnitud bajo el modelo normal asumido es esencialmente imposible.

Peligros

Supuesto de normalidad. El percentil y el valor p requieren que la distribución subyacente sea normal. Para datos no normales (sesgados, de colas pesadas, multimodales), las puntuaciones z aún son calculables pero su interpretación probabilística se rompe. La renta real, los tiempos de respuesta web y los rendimientos de acciones no son normales; la puntuación z para "el percentil 99 de los rendimientos" puede ser mucho menor que el +2,33 que predice el modelo normal.

σ de población frente a σ de muestra. La fórmula utiliza la σ de la población. Si tiene una muestra y utilizó la desviación estándar muestral s, en realidad está calculando una estadística t (distribución t de Student), no una z. Para muestras grandes (n > 30) las dos son casi idénticas; para muestras pequeñas, utilice tablas t explícitamente.

Sensibilidad a valores atípicos. Tanto μ como σ son sensibles a los valores atípicos: un único valor extremo puede arrastrar μ e inflar σ, distorsionando todas las puntuaciones z. Las alternativas robustas (mediana, MAD) se ven menos afectadas.

Límites de aproximación. La aproximación erf en la calculadora es precisa hasta 10⁻⁷; para probabilidades de cola profunda (z > 6), utilice bibliotecas especializadas (mpmath, scipy.stats.norm).

Valor p de dos colas frente a una cola. De dos colas: P(|Z| ≥ |z|), utilizado cuando la hipótesis alternativa es "diferente de μ". De una cola: P(Z ≥ z) o P(Z ≤ z), utilizado cuando la alternativa es "mayor que μ" o "menor que μ" específicamente. La calculadora muestra ambas; elija la que coincida con su hipótesis.

Múltiples pruebas. Si calcula puntuaciones z en 100 observaciones y pregunta "¿hay alguna con |z| > 2?", esperaría ~5 por pura casualidad incluso bajo la nula. Se necesita corrección de Bonferroni o FDR para comparaciones múltiples.

La estandarización no es una transformación a normal. La puntuación z de una variable no normal no la hace normal; solo la desplaza y la reescala. La forma se mantiene.

Caso límite σ = 0. Si σ = 0, la calculadora lo rechaza (sin varianza, sin z). Todas las observaciones están en μ.

Valores |z| muy grandes. La precisión doble de JS se desborda para |z| > 38; el percentil se satura en 0 % o 100 %. Las puntuaciones z del mundo real rara vez superan 8.

Intervalos de confianza frente a puntuaciones z. Un IC del 95 % utiliza z = 1,96; un IC del 99 % utiliza z = 2,576. Estos son cuantiles, no observaciones; la calculadora toma observaciones y calcula z, no la inversa.

Variaciones

Función inversa de la CDF (función cuantil): dado un percentil, encontrar la z correspondiente. Problema diferente.
Estadística t de Student: el análogo para muestras pequeñas con σ muestral.
Calculadora de tamaño de muestra: utiliza puntuaciones z para intervalos de confianza.
Detección de anomalías: las puntuaciones z o las puntuaciones z modificadas (mediana + MAD) marcan valores atípicos.
Índice Cpk de Six Sigma: índice de capacidad del proceso basado en la distancia z a los límites de especificación.