IC para a média: x̄ ± z·(σ/√n) para σ conhecido; t para amostras pequenas.
IC = x̄ ± crítico × (s/√n). A regra automática escolhe z quando n ≥ 30 (amostra grande, TCL) e t de Student com gl = n−1 caso contrário. O intervalo de 95% contém a média verdadeira em ~95% das amostras repetidas — NÃO é uma declaração de probabilidade sobre um único parâmetro fixo.
Uma média amostral é uma estimativa pontual — um único número obtido de uma amostra particular. Execute novamente a pesquisa, o ensaio ou o lote de produção e você quase certamente obterá um número diferente. O propósito da estatística inferencial é quantificar o quão longe essa variação pode plausivelmente levá-lo, e um intervalo de confiança (IC) é a ferramenta que faz isso. Em vez de dizer ao seu leitor "a satisfação média é de 7,4 em 10" — o que soa preciso, mas está silenciosamente incorreto sobre sua própria precisão — um IC diz "a satisfação média é de 7,4, e a verdadeira média populacional quase certamente está entre 6,8 e 8,0". Essa segunda frase é a que os tomadores de decisão precisam: ela lhes diz se a diferença entre dois produtos, duas coortes ou dois lotes é provavelmente real ou provavelmente ruído.
Os ICs se ajustam elegantemente a cada mudança. Amostra maior? O intervalo diminui. Mais variabilidade nos dados subjacentes? Ele se alarga. Nível de confiança mais alto exigido? Ele se alarga novamente. Um regulador que exige 99,9 % de certeza antes de aprovar um medicamento obterá um intervalo mais amplo — e precisará de um ensaio muito maior — do que um profissional de marketing satisfeito com 90 %. A matemática torna o trade-off explícito.
O intervalo é também o vocabulário certo para conversar com não-estatísticos. As pessoas entendem "entre 6,8 e 8,0" instintivamente; elas precisam ser treinadas para ler valores-p. Essa legibilidade é a razão pela qual todo periódico científico credível, todo relatório de auditoria e todo painel de teste A/B agora reporta ICs juntamente (ou no lugar de) testes de hipóteses.
Para a média de uma variável quantitativa, o intervalo de confiança bilateral é:
CI = x̄ ± critical × (s / √n)
onde x̄ é a média da amostra, s o desvio padrão da amostra, n o tamanho da amostra, e critical um multiplicador lido de uma tabela de probabilidades.
Duas distribuições fornecem o multiplicador:
A quantidade s / √n é o erro padrão da média — o desvio padrão de x̄ em amostras repetidas hipotéticas. Multiplicá-lo pelo valor crítico o escala para o nível de confiança que você escolheu.
STDEV.S(...) ou =STDEV(...).auto a menos que tenha uma razão específica para substituir. auto escolhe z quando n ≥ 30 e t com df = n − 1 abaixo desse limiar. Force z apenas quando σ é genuinamente conhecido a priori (raro). Force t para ser conservador em amostras pequenas, mesmo além do limiar de 30.O painel de resultados mostra os limites inferior e superior, a margem de erro, o valor crítico utilizado, o erro padrão e qual distribuição realizou o cálculo.
Um ensaio clínico mede o tempo de recuperação em 15 pacientes, encontra uma média de 7,4 dias com um desvio padrão amostral de 1,2 dias e deseja um IC de 95 %.
Agora, suponha que os mesmos números vêm de um ensaio muito maior com n = 1000 pacientes. O erro padrão cai para 1,2 / √1000 = 0,0379, a calculadora muda para z (n ≥ 30), crítico = 1,96, margem = 0,074. IC = [7,33, 7,47]. Mesma estimativa pontual, um intervalo dez vezes mais apertado — o tamanho da amostra compra precisão.
Um IC de 95 % não é "uma probabilidade de 95 % de que a média populacional esteja neste intervalo". A interpretação frequentista é "se repetíssemos o processo de amostragem indefinidamente, 95 % dos intervalos que construímos conteriam a verdadeira média". O parâmetro é fixo; o intervalo é aleatório. Pessoas que desejam a declaração de probabilidade precisam de um intervalo credível Bayesiano.
Um IC estreito não é o mesmo que um preciso. Se o seu método de amostragem for enviesado — amostras de conveniência, respondentes auto-selecionados, desistências — o IC será apertado, mas centrado no número errado. A estatística quantifica o erro de amostragem, não o erro de medição ou o viés de seleção. Uma pesquisa online com um milhão de respondentes ainda pode estar muito errada se os respondentes não se parecem com a população.
Os ICs assumem que os dados vêm de uma distribuição aproximadamente simétrica (ou que n é grande o suficiente para o CLT começar a agir). Dados muito enviesados — rendas, tempos de resposta, forças de reação biológicas — devem ser transformados (log) antes de aplicar a fórmula, ou analisados com um método não-paramétrico como um IC bootstrap.
Um IC para a média não é um intervalo de previsão para uma observação individual. O IC lhe diz onde a média reside; o intervalo de previsão (muito mais amplo, fator de ≈ √(1 + 1/n) maior) lhe diz onde o próximo valor individual provavelmente cairá.
Se você calcular muitos ICs simultaneamente — comparando 20 variantes de produtos, rastreando 100 genes — a taxa de erro familiar aumenta drasticamente. As correções de Bonferroni ou Benjamini-Hochberg alargam cada intervalo para manter o nível de confiança geral honesto.
Finalmente, um IC não diz nada sobre significância clínica ou de negócios. Uma melhoria perfeitamente significativa de 0,1 ponto na satisfação do usuário pode ser estatisticamente real e economicamente irrelevante. Sempre leia os limites em unidades de domínio antes de agir sobre eles.
Escolher o intervalo certo é metade da análise. Aplicar erroneamente um IC da média onde um IC de proporção ou um intervalo de previsão era necessário é um dos erros mais comuns na estatística aplicada — e um dos mais fáceis de evitar uma vez que as distinções acima estejam claras.