EAST - Modelo
EAST - Modelo
EAST - Modelo
x=
∑ x i = x 1+ x2 +…+ x n
n n
Sendo
x : média aritmética
xi: valores da variável
n: número de variáveis
x=
∑ x i = x 1+ …+ x n = 10+ 14+13+15+16 +18+12 = 98 =14
n n 7 7
Observação: Às vezes, a média pode ser um número diferente de todos os da série de
dados que ela representa. É o que acontece quando temos os valores 2,4, 6 e 8, para os
quais a média é 5. Esse será o número representativo dessa série de valores, embora
não esteja representado nos dados originais. Neste caso, costuma-se dizer que a média
não tem existência concreta.
x p=
∑ xn⋅ pn
∑ pn
Exemplo: O capital da empresa está sendo formado pelos acionistas, por financiamentos
e por debêntures. Cada tipo tem um custo diferente para a empresa, definido pela sua
taxa anual. Calcule a taxa de juros média do capital da empresa, considerando os dados
apresentados na tabela seguinte.
1000000 ⋅12% +600000 ⋅8 % +400000 ⋅14 %
x p= =32 , 8 %
1000000+ 600000+400000
Média Aritmética para Dados Agrupados sem Intervalos de Classe
As frequências são as quantidades de vezes que a variável ocorre na coleta de dados,
elas funcionam como fatores de ponderação, o que leva a se calcular a média aritmética
ponderada.
x=
∑ x i ⋅ f i = ∑ x i ⋅f i
n ∑ fi
Exemplo: Após ter sido realizado um trabalho bimestral, o professor efetuou o
levantamento das notas obtidas pelos alunos, observou a seguinte distribuição e calculou
a média de sua turma.
x=
∑ x i ⋅ f i = 26 =2 ,6
n 10
Exemplo: Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando
para variável o número de filhos do sexo masculino.
Nesse caso, como as frequências são números indicadores da intensidade de cada valor
da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a
média aritmética ponderada, dada pela fórmula.
x=
∑ xi ⋅ f i
∑ fi
O mais prático de obtenção da média aritmética ponderada é abrir, na tabela, uma coluna
correspondente aos produtos x i ⋅ f i.
Temos então ∑ x i ⋅f i =78 e ∑ f i=34 , ou seja:
78
x= =2 , 29 ≅ 2 , 3
34
Observação: Sendo x uma variável discreta, como interpretar o resultado obtido, 2
meninos e 3 décimos de meninos? O valor médio 2,3 meninos sugere, nesse caso, que o
maior número de famílias tem 2 meninos e 2 meninas, sendo porém, a tendência geral de
uma leve superioridade numérica em relação ao número de meninos.
x=
∑ x i ⋅ f i = ∑ x i ⋅f i
n ∑ fi
Onde xi é o ponto médio da classe.
Exemplos: Consideremos a distribuição:
Vamos, inicialmente, abrir uma coluna para os pontos médios e o outra para os produtos
x i · f i.
x=
∑ x i ⋅ f i = 6440 =161cm
∑ fi 40
Propriedades da Média
1. A soma algébrica dos desvios tomados em relação à média é nula.
k
d i=∑ ( xi −x )=0 → ∑ d i=0
i=1
∑ d i=(−4)+0+(−1)+ 1+ 2+ 4+(−2)=0
i=1
Daí:
7
∑ y=12+16+15+17+ 18+20+14=112
i=1
Como n = 7:
112
y= =16 → y=16=14+ 2→ y=x +2
7
3. Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante
(c), a média do conjunto fica multiplicada (ou dividida) por essa constante.
xi x
y i=x i ⋅c → y=x ⋅c ou yi = → y=
c c
Multiplicando por 3 cada um dos valores da variável do exemplo dado, obtém-se:
y 1=3 y 2=42 y 3=39 y 4 =45
y5 =48 y 6=54 y 7 =36
Daí:
7
Como n = 7, tem-se:
294
y= =42 → y =42=14 ·3 → y=x ·3
7
Observação: a média é utilizada quando:
Deseja-se obter a medida de posição que possui maior estabilidade.
Houver necessidade de um tratamento algébrico ulterior.
Moda
Denomina-se moda o valor que ocorre com maior frequência em uma série de valores.
Dessa forma, o salário modal dos empregados de uma empresa é o salário mais comum,
isto é, o salário recebido pelo maior número de empregados dessa empresa.
¿ D1 ¿
Mo=l + ⋅h
D1 + D2
Na qual
l* é o limite inferior da classe modal
h* é a amplitude da classe modal
¿ ¿
D1=f −f anterior D2=f −f posterior
¿ D1 ¿ 2 8
M 0=l + ⋅h → M 0=158+ ⋅4 → M 0=158+ =158+1 , 6=159 ,6
D1 + D2 2+3 5
Logo MO = 159,6 cm
As Expressões Gráficas da Moda
Mediana
A mediana é a medida de posição definida como o número que se encontra no centro de
uma série de números, estando estes dispostos segundo uma ordem. Ou seja, a mediana
de um conjunto de valores, ordenados segundo uma ordem de grandeza, é um valor
situado de tal modo no conjunto que o separa em dois subconjuntos de mesmo número
de elementos.
Mediana (Md)
Para Dados Não-Agrupados Para se descobrir o elemento mediano de uma série devem-
se seguir os procedimentos abaixo:
Se N (número de elementos do conjunto) for ímpar a mediana é o termo de ordem P
dado pela razão:
N +1
P=
2
Se N (número de elementos do conjunto) for par, a mediana é a média aritmética dos
termos de ordem, em um primeiro passo de P1 (média aritmética simples) e, em
seguida, pela razão P2 (termo subsequente da ordem P).
N N
P 1= P 2= +1
2 2
Exemplo: Determine o valor da mediana da série que é composta pelos seguintes
elementos: 56, 65, 58, 62, e 90.
Colocar os elementos em ordem: 56, 58, 62, 65 e 90.
N = 5 (ímpar)
N +1 5+1
P= = =3 →3 º elemento → Md =62
2 2
Exemplo: Em uma pesquisa realizada a respeito de erros por folha, cometidos por
digitadores, revelou as seguintes quantidades: 12, 13.15, 13, 12, 18, 16, 20. Determinar a
quantidade mediana de falhas.
Colocar os dados em ordem: 12, 12, 13, 13, 15, 16, 18 e 20.
N = 8 (par)
N 8
P 1= = =4 → 4 º elemento→ Md=13
2 2
N 8
P 2= + 1= +1=4 +1=5 → 5º elemento → Md=15
2 2
13+15 28
M d= = =14
2 2
Observações:
O valor da mediana pode coincidir ou não com um elemento da série. Quando o
número de elementos da série é ímpar, há coincidência. O mesmo não acontece,
porém, quando esse número é par.
Se uma lista de valores tem um número ímpar de elementos, a mediana é o valor do
meio, quando a lista se apresenta ordenada; se a lista tem número par de elementos,
então a mediana é a média dos dois números mais próximos do meio.
A mediana e a média aritmética não têm, necessariamente, o mesmo valor.
Outra forma de resolução: Organizar os dados em um rol e fazer a média dos termos
centrais.
12, 12, 13, 13, 15, 16, 18, 20
Termos centrais: 13 e 15
Efetuamos a média aritmética
13+15 28
= =14
2 2
Exemplo: Dada a série de valores 5, 13, 10, 2, 18, 15, 6, 16, 9, determine a média e a
mediana:
Colocando os elementos em ordem: 2, 5, 6, 9, 10, 13, 15, 16, 18
2+5+ 6+9+10+13+ 15+16+18
Média : x = =10 , 4
9
Mediana : Md=10
A mediana depende da posição dos valores dos elementos na série ordenada. Essa é
uma das diferenças marcantes entre a mediana e a média (que se deixa influenciar, e
muito, pelos valores extremos.
Exemplos:
5, 7, 10, 13, 15 → x = 10 e Md = 10
5, 7, 10, 13, 65 → x = 20 e Md = 10
Observação: A média do segundo conjunto de valores é maior do que a do primeiro, por
influência dos valores extremos, ao passo que a mediana permanece a mesma.
A mediana é designada, muitas vezes, por valor mediano.
∑ fi
2
Neste caso, é o bastante identificar a frequência acumulada imediatamente superior à
metade da soma das frequências. A mediana será o valor da variável que corresponde à
tal frequência acumulada.
Exemplo:
Sendo
∑ f i = 34 =17
2 2
A menor frequência acumulada que supera esse valor é 18, que corresponde ao valor 2
da variável, sendo este o valor mediano. Logo Md = 2 meninos.
Observação: No caso de existir uma frequência acumulada (Fi), tal que será dada por
F i=∑ f i /2, a mediana dada por Md=(x i + x i+1)/2 , isto é, a mediana será a média
aritmética entre o valor da variável correspondente a essa frequência acumulada e o
seguinte.
Exemplo:
Temos:
∑ f i = 8 =4=F
3
2 2
Logo:
x i + x i+1 15+ 16 31
M d= = = =15 , 5
2 2 2
Temos
∑ f i = 40 =20
2 2
Como há 24 valores incluídos nas três primeiras classes da distribuição e como se
pretende determinar o valor que ocupa o 20º lugar, a partir do início da série, observa-se
que este deve estar localizado na terceira classe (i = 3), supondo que as frequências
dessas classes estejam uniformemente distribuídas.
Como existem 11 elementos nessa classe e o intervalo de classe é igual a 4, deve-se
tomar, a partir do limite inferior, a distância, e a mediana serão dadas por:
7 28
Md=158+ ⋅4=158+ =158+ 2, 54=160 , 54
11 11
Logo Md = 160,5 cm.
Md=l¿ +
(∑ 2
fi
)
−F anterior ⋅h
¿
f¿
Na qual:
l* é o limite inferior da classe mediana.
Fanterior é a frequência acumulada da classe anterior à classe mediana.
f* é a frequência simples da classe mediana.
h* é a amplitude do intervalo da classe mediana.
Exemplo:
∑ f i = 40 =20
2 2
Logo, a classe mediana é a de ordem 3. Então l* = 158, Fanterior = 13, f* = 11 e h* = 4.
Substituindo esses valores na fórmula, obtém-se:
( 20−3 ) ⋅4 ⋅ 4 28
Md=158+ =158+ =158+2 ,54=160 , 54
11 11
Logo Md = 160,5 cm.
Emprego da Mediana
Emprega-se a mediana quando:
Deseja-se obter o ponto que divide a distribuição em partes iguais.
Existem valores extremos que afetam de uma maneira acentuada a média.
A variável em estudo é salário.
As Separatrizes
Outras medidas de posição, como os quartis, os decis e os percentis, embora sejam
medidas de posição, possuem uma característica muito especial: separam os conjuntos
em quantidades de iguais valores. Por isso, essas medidas podem ser chamadas de
separatrizes.
Alguns estudiosos de Estatística preferem chamar as separatrizes de medidas de posição
e a média, a mediana e a moda (que também são medidas de posição), preferem chamar
de medidas de tendência central. Os autores não concordam quanto a melhor maneira de
considerá-las.
Quartis, decis e percentis são medidas de posição, isto é, semelhantes às medidas de
tendência central, indicam uma determinada localização em relação ao conjunto de dados
em estudo. Entretanto, separam o conjunto em 4 partes iguais (quartis), 10 partes iguais
(decis) ou 100 partes iguais (percentis), ou seja, em partes que apresentam o mesmo
número de valores. Por isso, alguns autores preferem as medidas de posição (quartis,
decis e percentis) de separatrizes (juntamente com a mediana).
Os Quartis
Denominam-se quartis os valores de uma série que a dividem em quatro partes. Existem,
portanto, três quartis:
a) O primeiro quartil (Q1) – valor situado de tal modo na série que uma quarta parte (25%)
dos dados é menor que ele e as três quartas partes restantes (75%) são maiores.
b) O segundo quartil (Q2) – evidentemente, coincide com a mediana (Q2 = Md).
c) O terceiro quartil (Q3) – valor situado de tal modo que as três quartas partes (75%) dos
termos são menores que ele e uma quarta parte (25%) é maior.
Quando os dados são agrupados, para determinar os quartis usa-se a mesma técnica do
cálculo da mediana, bastando substituir, na fórmula da mediana, ∑ f i /2 por:
k∑ f i
4
Sendo k o número de ordem do quartil. Assim, tem-se:
¿
Q1=l +
( ∑ f i −F
4 anterior
¿
) ⋅h
¿
¿
Q2=l +
( ∑ f i −F
2 anterior ) ¿
⋅h
f f¿
Q 3=l ¿ +
4 (
3∑ f i
−F anterior ⋅ h¿
¿
)
f
Os Percentis
Denominam-se percentis os noventa e nove valores que separam uma série em 100
partes iguais.
Indicam-se: P1, P2, P3, ..., P25, ..., P50, ..., P75, ..., P99.
É evidente que: P50 = Md; P25 = Q1; e P75 = Q3.
O cálculo de um percentil segue a mesma técnica do cálculo da mediana, no entanto, a
fórmula ∑ f i /2 será substituída por:
k∑ f i
100
Sendo k o número de ordem do percentil.
Logo, P8 = 153,2 cm. Significa que 8% possuem estatura inferior a 153,2.
Capítulo 7 – Medidas de Dispersão ou de Variabilidade
Dispersão ou Variabilidade
As medidas de dispersão ou variabilidade são empregadas para descobrir o grau de
variabilidade ou dispersão dos valores observados em torno da média aritmética. Servem
para medir a representatividade da média e destacam o nível de homogeneidade ou
heterogeneidade dentro de cada grupo estatístico analisado.
Quando se trata de interpretar dados estatísticos é necessário ter-se uma ideia
retrospectiva de como se apresentavam esses mesmos dados nas tabelas. Assim, não é
o bastante dar uma das medidas de posição para caracterizar perfeitamente um conjunto
de valores.
“Se uma pessoa comeu dois salgadinhos e outra não comeu nenhum, em média cada
uma comeu um salgadinho.” Essa frase, que tem relação com a Estatística, não agradou
muito àquele que ficou com fome. Ao se fazer a média, há sempre informação que se
perde.
A média, apesar de ser uma medida muito usada em Estatística, é muitas vezes
insuficiente para caracterizar uma distribuição. A moda e a mediana também são medidas
que não informam muito sobre como as variáveis se alteram. Por isso, foi preciso e
ncontrar outro indicador que informasse sobre a maneira como os dados se distribuem em
torno da média.
Exemplo:
Um empresário deseja comparar o desempenho de dois empregados, com base na
produção diária de determinada peça, durante cinco dias.
Empregado A: 70, 71, 69, 70, 70 → 70
Empregado B: 60, 80, 70, 62, 83 → 71
O desempenho médio do empregado A é de 70 peças produzidas diariamente, enquanto
que a do empregado B é de 71 peças. Com base na média aritmética, verifica- se que o
desempenho de B é melhor do que o de A.
No entanto, observando bem os dados, percebe-se que a produção de “A” varia apenas
de 69 a 71 peças, ao passo que a de “B” varia de 60 a 83 peças, o que revela que o
desempenho de A é bem mais uniforme do que o de B.
Portanto, para qualificar os valores de uma dada variável, ressaltando a maior ou menor
dispersão ou variabilidade entre esses valores e a sua medida de posição, a Estatística
recorre às medidas de dispersão. Dessas medidas, serão destacadas neste estudo a
amplitude total, a variância, o desvio padrão, o coeficiente de variação, e o desvio
médio.
Amplitude Total
Dados não Agrupados
A amplitude total é a diferença entre o maior e o menor valor observado:
AT =x max−x min
Exemplos:
a) Para os valores: 40, 45, 48, 52, 54, 62 e 70 Tem-se: AT = 70 − 40 = 30
b) Para a situação sugerida anteriormente.
Empregado A: 70, 71, 69, 70, 70 → 70
Empregado B: 60, 80, 70, 62, 83 → 71
Empregado A → AT = 71 − 69 = 2
Empregado B → AT = 83 − 60 = 23
Dados Agrupados
1. Sem intervalos de classe
Neste caso, tem-se: AT = xmax - xmin Considerando a tabela abaixo.
AT = 4 − 0 = 4
2. Com intervalos de classe
Neste caso, a amplitude total é a diferença entre o limite superior da última classe e o
limite inferior da primeira classe.
Variância (Var)
O desvio médio é uma boa medida de dispersão porque dá a distância média de cada
número em relação à média. No entanto, para muitas finalidades, é mais conveniente
elevar ao quadrado cada desvio e tomar a média de todos esses quadrados. Essa
grandeza é chamada variância.
Exemplo:
Empregado A: 70, 71, 69, 70, 70 → 70
Empregado B: 60, 80, 70, 62, 83 → 71
2 2 2 2 2
|70−70| +|71−70| +|69−70| +|70−70| +|70−70|
V ar ( A ) =
5
2 2 2 2 2
0 +1 +1 +0 +0 2
V ar ( A ) = = =0 , 4
5 5
2 2 2 2 2
|60−7 1| +|80−70| +|70−7 1| +|62−7 1| +|83−7 1|
V ar ( B )=
5
2 2 2 2 2
11 + 9 + 1 + 9 + 12 428
V ar ( A ) = = =85 , 6
5 5
Notas:
Dado um conjunto de dados, a variância é uma medida de dispersão que mostra o quão
distante cada valor desse conjunto está do valor central (médio).
Quanto menor é a variância, mais próximos os valores estão da média; mas quanto maior
ela é, mais os valores estão distantes da média.
Desvio Padrão (Dp)
Introdução
A variância é uma boa medida de dispersão, mas tem uma desvantagem: é difícil
interpretar o valor numérico da variância. Uma variância de 85,6 significa uma grande
dispersão ou uma pequena dispersão? Parte do problema se deve à questão das
unidades: a variância é medida em uma unidade que é o quadrado da unidade de medida.
Em geral, é mais conveniente calcular a raiz quadrada da variância, chamada desvio
padrão. Quanto maior for o desvio padrão, maior será a heterogeneidade entre os valores
que estão sendo analisados. Isso significa, portanto, que quanto maior for o desvio
padrão, maior será a variação entre os valores.
Exemplo:
Empregado A: 70, 71, 69, 70, 70 → 70
Empregado B: 60, 80, 70, 62, 83 → 71
2 2 2 2 2
|70−70| +|71−70| +|69−70| +|70−70| +|70−70|
V ar ( A ) =
5
2 2 2 2 2
0 +1 +1 +0 +0 2
( )
V ar A = = =0 , 4 → D p ( A )= √ V ar ( A )=√ 0 , 4 ≅ 0 ,63
5 5
2 2 2 2 2
|60−7 1| +|80−70| +|70−7 1| +|62−7 1| +|83−7 1|
V ar ( B )=
5
2 2 2 2 2
11 + 9 + 1 + 9 + 12 428
V ar ( A ) = = =85 , 6 → D p ( B )=√ V ar ( B )=√ 85 , 6 ≅ 9 , 25
5 5
Observações:
Quanto menor o desvio padrão, mais os valores da variável se aproximam de sua média.
Quanto maior o desvio padrão, mais significativa a heterogeneidade entre os elementos
de um conjunto, ou seja, maior será a variação entre os valores.
D p= √ V ar → D p=
√ ∑ ( x i−x )2
n
Tanto o desvio padrão como a variância são usados como medidas de dispersão ou
variabilidade. O uso de uma ou de outra dependerá da finalidade que se tenha em vista. A
variância é uma medida que tem pouca utilidade como estatística descritiva, porém é
extremamente importante na inferência estatística e em combinações de amostras.
Se bem que a fórmula dada para o cálculo do desvio seja a que torna mais fácil a sua
compreensão, ela não é uma boa fórmula para fins de computação, pois em geral, a
média aritmética x é um número fracionário, o que torna pouco prático o cálculo das
quantidades (xi − x )².
Os cálculos podem ser simplificados fazendo uso da igualdade:
∑ ( xi )
2
∑ ( xi −x ) =∑ ( x i )
2 2
−
n
√ (∑ x i )
√
2
( )
2
D p= ∑x −
2
→ D p=
∑ x 2i − ∑ x i
i
n n n
Com n = 7, tem-se:
√ ( )
∑ x 2i − ∑ x i
√
2
( )
2
20293 371
=√ 2899−53 =√ 2899−2809=√ 90 ≅ 9,486
2
D p= = −
n n 7 7
√ (
∑ f i x 2i − ∑ f i x i
)
2
D p=
n n
Exemplo:
Considerando a distribuição da tabela abaixo, calcular o desvio padrão. O modo mais
prático para se calcular o desvio padrão é abrir, na tabela dada, uma coluna para os
produtos f i x i e outra para f i x 2i , lembrando que para se obter f i x 2i , basta multiplicar cada
f i x i pelo seu respectivo x i.
Assim:
√ ( )
∑ x 2i − ∑ x i
2
D p=
n n
D p=
√ 30
−( )
165 63 2
50
=√ 5 ,5−4 , 41=√ 1 , 09 ≅ 1,044
Logo: Dp = 1,04.
2. Com intervalos de classe
Exemplo:
Considerando a distribuição da tabela abaixo, calcular o desvio padrão.
√ ( )
∑ x 2i − ∑ x i
√
2
( )
2
1038080 6440
D p= = − = √ 25952−25921=√ 31=5,567
n n 40 40
√ (
∑ f i y 2i − ∑ f i xi
)
2
D p=h⋅
n 2
Exemplo:
Considerando a distribuição da tabela abaixo, calcular o desvio padrão.
√ (
∑ f i y 2i − ∑ f i xi
) √
2
( )
2
0 10
D p=h⋅ =4 ⋅ − =4 ⋅ √ 2−0,0625=4 ⋅ √ 1,9375=4 ⋅1,3919
n n 40 40
Dp 5 ,57
C V ( %) = ⋅100= ⋅100=0,03459⋅100=3,459 %
Média 161
Logo CV = 3,46%.
Se bem que, para qualificar a dispersão de uma distribuição, seja mais proveitoso o
coeficiente de variação, não devemos deduzir daí que a variância e o desvio padrão
careçam de utilidade. Pelo contrário, são medidas muito úteis no tratamento de assuntos
relativos à inferência estatística.
Observações:
O coeficiente de variação fornece a variação dos dados obtidos em relação à média.
Quanto menor for o seu valor, mais homogêneos serão os dados.
O coeficiente de variação é considerado baixo (apontando um conjunto de dados bem
homogêneos) quando for menor ou igual a 25%.
O fato de o coeficiente de variação ser dado em valor relativo nos permite comparar
séries de valores que apresentam unidades de medida distintas.
Exemplo:
Compare a variabilidade relativa do tempo de reação de um analgésico A com a
variabilidade do peso das pessoas que se submeteram à dosagem desse analgésico. As
médias e os desvios padrão foram.
Analgésico A: Média = 3 min e DP = 0, 71.
Peso das pessoas: Média = 58,25 kg e DP = 5, 17.
Vamos calcular o coeficiente de variação para cada item observado.
Cálculo para o tempo de reação do analgésico:
0 , 71
C V =100 · =23 , 67 %
3
Cálculo para o peso das pessoas:
5 , 17
C V =100 · =8 , 88 %
58 , 25
Comparando o coeficiente de variação do tempo de reação do analgésico e o do peso das
pessoas, podemos concluir que os dados referentes ao peso são mais consistentes que
os dados referentes ao tempo de reação do analgésico, ou ainda, que os dados
referentes ao peso são mais homogêneos que os do tempo de reação do analgésico.
Observações: