Desvio padrão

Fonte: SAPO Saber, a enciclopédia portuguesa livre.

Em probabilidade e Estatística, o desvio padrão é a medida mais comum da dispersão estatística. O desvio padrão define-se como a raiz quadrada da variância. É definido desta forma de maneira a dar-nos uma medida da dispersão que:

  1. seja um número não negativo;
  2. use as mesmas unidades de medida que os nossos dados.

Faz-se uma distinção entre o desvio padrão σ (sigma) do total de uma população ou de uma variável aleatória, e o desvio padrão s de um sub-conjunto em amostra.

O termo desvio padrão foi introduzido na estatística por Karl Pearson no seu livro de 1894: "Sobre a dissecção de curvas de frequência assimétricas".

Índice

[editar] Definição e cálculo

[editar] Desvio padrão de uma variável aleatória

O desvio padrão de uma variável aleatória X é definido como:

Falhou ao verificar gramática (Executável texvc não encontrado; Consulte math/README para instruções da configuração.): \operatorname{\sigma} = \sqrt{\operatorname{E}((X-\operatorname{E}(X))^2)} = \sqrt{\operatorname{E}(X^2) - (\operatorname{E}(X))^2}


onde Falhou ao verificar gramática (Executável texvc não encontrado; Consulte math/README para instruções da configuração.): \operatorname{E}(X)

é o valor esperado de X.

Nem todas as variáveis aleatórias possuem desvio padrão, porque esses valores esperados não precisam existir. Por exemplo, o desvio padrão de uma variável que flui em uma distribuição de Cauchy é indefinido.

[editar] Desvio padrão amostral

Se uma variável aleatória Falhou ao verificar gramática (Executável texvc não encontrado; Consulte math/README para instruções da configuração.): \operatorname{X}

toma os valores Falhou ao verificar gramática (Executável texvc não encontrado; Consulte math/README para instruções da configuração.):  \operatorname{x}_1,\dots,\operatorname{x}_n 

, então o desvio padrão para esta amostra de n números (ou desvio padrão amostral) pode ser computado como segue. Primeiro, a média de Falhou ao verificar gramática (Executável texvc não encontrado; Consulte math/README para instruções da configuração.): \operatorname{X} , \overline{x}, é definida como:

Falhou ao verificar gramática (Executável texvc não encontrado; Consulte math/README para instruções da configuração.): \overline{x} = \dfrac{1}{n}\sum_{i=1}^n x_i = \dfrac{x_1+x_2+\cdots+x_n}{n}


(veja notação sigma). Depois, o desvio padrão amostral é calculado como:

Falhou ao verificar gramática (Executável texvc não encontrado; Consulte math/README para instruções da configuração.): s = \sqrt{\dfrac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x})^2}


A divisão por n − 1 aparece quando exigimos que a variância amostral Falhou ao verificar gramática (Executável texvc não encontrado; Consulte math/README para instruções da configuração.): \operatorname{s}^2

seja um estimador não tendencioso da variância populacional Falhou ao verificar gramática (Executável texvc não encontrado; Consulte math/README para instruções da configuração.): \operatorname{\sigma}^2

.

Quando os dados estão agrupados(frequência) temos:

Falhou ao verificar gramática (Executável texvc não encontrado; Consulte math/README para instruções da configuração.): s = \sqrt{\dfrac{1}{\sum_{i=1}^k {f_i}-1} \sum_{i=1}^k ((x_i - \overline{x})^2 \times f_i)}


onde k é o número de observações diferentes.


Em outras palavras, o desvio padrão amostral de uma variável aleatória X pode ser calculada como:

  1. Para cada valor Falhou ao verificar gramática (Executável texvc não encontrado; Consulte math/README para instruções da configuração.): x_i
calcula-se a diferença x_i - \overline{x} entre Falhou ao verificar gramática (Executável texvc não encontrado; Consulte math/README para instruções da configuração.):  x_i 
e o valor médio \overline{x}.
  1. Calcula-se o quadrado dessa diferença. No caso dos dados estarem tabelados (com frequências), multiplica-se cada um destes quadrados pela respectiva frequência.
  2. Encontra-se a soma dos quadrados das diferenças. No caso dos dados estarem tabelados (com frequências), a soma é a dos produtos dos quadrados das diferenças pela respectiva frequência.
  3. Divide-se este resultado por: (número de valores - 1), ou seja, Falhou ao verificar gramática (Executável texvc não encontrado; Consulte math/README para instruções da configuração.): (n-1)

.Esta quantidade é a variância Falhou ao verificar gramática (Executável texvc não encontrado; Consulte math/README para instruções da configuração.): s^2 .

  1. Tome a raiz quadrática deste resultado.

[editar] Propriedades

thumb|300px|A distribuição normal. De uma distribuição normal unimodal, simétrica, de afunilamento médio (ou mesocúrtica) podemos dizer o seguinte:

  • 68% dos valores encontram-se a uma distância da média inferior a um desvio padrão.
  • 95% dos valores encontram-se a uma distância da média inferior a duas vezes o desvio padrão.
  • 99,7% dos valores encontram-se a uma distância da média inferior a três vezes o desvio padrão.

Esta informação é conhecida como a regra dos "68-95-99,7".

[editar] Ver também

[editar] Ligações Externas

" style="vertical-align:middle; padding-left:7px; width:0%;">}}}}

Ferramentas pessoais