Desvio padrão

03Como funciona

Porquê este cálculo

Média única raramente conta a história completa sobre um conjunto de dados. Duas classes podem ter ambas uma nota média de 12 em 20, mas uma pode estar rigidamente agrupada em torno dessa média enquanto outra se divide num grupo de alunos de alto desempenho e outro que luta para acompanhar. Duas fábricas podem produzir peças com o mesmo diâmetro médio, mas uma entrega mercadorias consistentes e outra rejeita metade da sua produção por estar fora de tolerância. O desvio padrão captura exatamente a dimensão que a média ignora: quão espalhados os valores estão em torno do centro. É a única estatística mais utilizada fora da própria média, o bloco de construção de intervalos de confiança, testes de hipóteses, gráficos de controlo e métricas de risco, e é o primeiro número que qualquer analista de dados calcula depois da média. Este calculador pega numa lista de números (separados por espaços, vírgulas ou novas linhas), e retorna a média, a mediana, a variância, o desvio padrão sob ambas as convenções (amostra e população), a amplitude e o coeficiente de variação - o suficiente para caracterizar a localização e a dispersão de um conjunto de dados numa única tela.

A fórmula

O desvio padrão é a raiz quadrada da variância, e a variância é o desvio quadrático médio da média. Existem dois tipos. O desvio padrão populacional σ usa a fórmula σ = √(Σ(xᵢ − μ)² / N), onde N é o número de valores e μ é a média. O desvio padrão amostral s usa Σ(xᵢ − x̄)² / (n − 1), com o divisor reduzido em um - esta é a correção de Bessel, e remove um pequeno viés que, de outra forma, faria com que o desvio padrão amostral subestimasse sistematicamente o verdadeiro desvio padrão populacional quando computado a partir de uma amostra finita. Quando os dados que você tem são a população inteira (todos os alunos da turma, todos os parafusos produzidos hoje), use a fórmula da população. Quando os dados são uma amostra retirada de uma população maior (uma sondagem de 1.000 eleitores, uma amostra de controlo de qualidade de 50 peças), use a fórmula da amostra. O padrão neste calculador é a fórmula da amostra porque corresponde ao caso mais comum: você tem uma amostra e quer estimar o DP da população. O coeficiente de variação é o desvio padrão dividido pela média, expresso como uma percentagem; é adimensional e permite comparar a dispersão entre conjuntos de dados com unidades ou escalas diferentes.

Como usá-lo

Cole ou digite os seus números na caixa de texto. Os separadores podem ser vírgulas, espaços, ponto e vírgula ou novas linhas (ou qualquer mistura destes). Tokens não numéricos são silenciosamente ignorados, portanto, você pode colar uma coluna diretamente de uma folha de cálculo sem a limpar. O alternador abaixo muda entre o desvio padrão amostral e populacional. O painel de resultados mostra o DP como a principal KPI, juntamente com a média, a mediana (que é robusta a valores atípicos de uma forma que a média não é), a variância, a amplitude (máximo menos mínimo) e o coeficiente de variação. A série padrão são dez notas espalhadas entre 9 e 18, o que dá uma média de 13,5 e um DP amostral de 2,51 - números concretos para brincar.

Exemplo prático

Pegue no conjunto de dados 12, 14, 11, 15, 13, 16, 10, 18, 14, 12 (n = 10). A média é a soma dividida por n: (12+14+11+15+13+16+10+18+14+12)/10 = 135/10 = 13,5. Os desvios quadrados da média são 2,25, 0,25, 6,25, 2,25, 0,25, 6,25, 12,25, 20,25, 0,25, 2,25, somando 52,5. Divida por n = 10 (população) e obtenha uma variância de 5,25 e um DP populacional de √5,25 ≈ 2,29. Divida por n − 1 = 9 (amostra) e obtenha uma variância de ≈ 5,83 e um DP amostral de ≈ 2,41. A mediana, ordenada, é a média do quinto e sexto valores, (13 + 14)/2 = 13,5 - igual à média, sugerindo uma distribuição aproximadamente simétrica. A amplitude é 18 − 10 = 8. O coeficiente de variação é 2,41 / 13,5 ≈ 17,9 %, o que significa que a dispersão é cerca de um sexto do tamanho médio - um nível típico de variabilidade para notas.

Armadilhas comuns

Primeiro, escolher o divisor errado. A fórmula amostral usa n − 1; usar n numa amostra pequena distorce o DP para baixo. A diferença importa mais quando n é pequeno: a n = 5, os dois diferem cerca de dez por cento; a n = 100, por meio por cento. Segundo, tratar o desvio padrão como um intervalo de confiança. O DP descreve a dispersão dos dados; o erro padrão da média (EP = DP / √n) descreve a incerteza sobre a média. Eles estão errados por um fator de √n. Terceiro, computar DP em dados que não são normais. A regra 68/95/99,7 (um, dois, três DP cobrem essas percentagens dos dados) só se aplica a uma distribuição Gaussiana. Dados assimétricos ou com caudas pesadas terão muito mais valores atípicos do que a regra prevê. Quarto, misturar unidades. A variância está em unidades ao quadrado, o DP está nas unidades originais; gráficos que plotam variância contra um eixo nas unidades originais são enganosos. Quinto, ignorar valores atípicos. Um único valor extremo pode inflar o DP além de todo o reconhecimento; a mediana do desvio absoluto (MAD) é uma alternativa mais robusta.

Variações e contexto

O DP tem muitos primos. O intervalo interquartil (Q3 − Q1) ignora os 25% superiores e inferiores e é robusto a valores atípicos. A mediana do desvio absoluto é a mediana dos desvios absolutos da mediana - uma estatística de dispersão ainda mais robusta. O desvio médio absoluto usa valores absolutos em vez de quadrados e está mais próximo da intuição de um leigo de "distância média da média", mas é menos matematicamente tratável, razão pela qual os quadrados venceram a disputa histórica. O desvio padrão ponderado permite que diferentes observações contem mais do que outras (útil quando os pontos de dados representam grupos de tamanhos diferentes). Nos mercados financeiros, o DP dos retornos é o que as pessoas chamam de volatilidade, geralmente cotado anualmente após multiplicar por √(dias de negociação por ano). Na física e engenharia, o DP é relatado como incerteza numa medição; em psicometria, fundamenta o z-score, no controlo de qualidade o índice de capacidade do processo Cpk, e em machine learning o escalonador padrão que normaliza as características para média zero e DP um antes do treino.