Aula Estatística Descritiva
Aula Estatística Descritiva
Aula Estatística Descritiva
Bioestatística
Ciências biológicas
a
USP – ESALQ
Formulação
de hipóteses
Formulação
de hipóteses
Planejamento
estatístico
Formulação
de hipóteses
Planejamento
estatístico
Observação
dos dados
Planejamento
estatístico
Observação
dos dados
Análise
estatística
LR Nakamura Estatística ESALQ 2 / 67
Estatística
Estatística e o método científico
Planejamento
estatístico
Verificação
Observação
das hipóteses
dos dados
formuladas
Análise
estatística
LR Nakamura Estatística ESALQ 2 / 67
Estatística
Estatística e o método científico
Desenvolvimento Planejamento
da teoria estatístico
Verificação
Observação
das hipóteses
dos dados
formuladas
Análise
estatística
LR Nakamura Estatística ESALQ 2 / 67
Estatística
Estatística e o método científico
Desenvolvimento Planejamento
da teoria estatístico
Verificação
Observação
das hipóteses
dos dados
formuladas
Análise
estatística
LR Nakamura Estatística ESALQ 2 / 67
Estatística
Estatística e o método científico
Estatística
Inferência
Descritiva
Definição
A estatística descritiva é um ramo da estatística que aplica várias
técnicas para descrever e sumarizar um conjunto de dados.
Variáveis
Variável
Variáveis
Qualitativa
Variável
Quantitativa
Variáveis
As Variáveis podem ser classificadas como:
Nominal
Qualitativa
Ordinal
Variável
Quantitativa
Variáveis
As Variáveis podem ser classificadas como:
Nominal
Qualitativa
Ordinal
Variável
Discreta
Quantitativa
Contínua
Variáveis Qualitativas
Variáveis Qualitativas
Variáveis Qualitativas
Variáveis Quantitativas
Variáveis Quantitativas
Variáveis Quantitativas
Tabela
Dados Resumo da
Brutos Informação
Gráfico
Dados Brutos
São dados na forma como foram obtidos.
Construção de Tabelas
Construção de Tabelas
Construção de Tabelas
Frequência relativa
Frequência acumulada
Frequência relativa acumulada
Frequência relativa
ni
fi =
Total
Representação Gráfica
Elementos Gráficos
Gráfico de setores
Diagrama de Pareto
Representação Gráfica
Elementos Gráficos
Gráfico de setores
Diagrama de Pareto
Gráfico de barras
Gráfico de Barras
Bom
Regular
1000
Ruim
Não Sabe
600
0 200
Não Sabe
Qualidade de Serviço
Ruim
Regular
Bom
Gráfico de setor
Gráfico de setor (Pizza)
Bom (52%)
Gráfico de Pareto
Gráfico de Pareto
100%
2500
2000
Porcentagem Acumulativa
75%
1500
Frequência
50%
1000
25%
500
0%
0
Bom
Não Sabe
Regular
Ruim
Figura: Gráfico de Pareto para qualidade do serviço dos funcionários de
uma linha de produção
Gráfico de Pontos
Gráfico de Pontos
6000
5500
rendimentos
5000
4500
4000
0 5 10 15 20 25 30
Máquina
38 | 7
40 |
42 |
44 | 055
46 | 16896778
48 | 56889
50 | 661277
52 | 03
54 | 01
56 |
58 | 29
60 | 57
62 | 9
Histograma
Histograma para total de peças produzidas
12
10
Frequencias absolutas
8
6
4
2
0
12
10
8
Frequência
6
4
2
0
12
10
8
Frequência
6
4
2
0
12
10
8
Frequência
6
4
2
0
Ogiva de Galton
Ogiva de Galton
Frequência absoluta acumulada (Curva de frequências acumuladas)
30
20
10
0
Medidas
Tendência Central
Dispersão
Posição
Tendência Central
Média
Moda
Mediana
Medidas
Tendência Central
Dispersão
Posição
Tendência Central
Média
Moda
Mediana
Definição
O Somatório de xi , . . . , xn variáveis é definido por
n
X
xi = x1 + x2 + . . . + xn
i=1
Propriedades de somatório
Sejam k, a e b constantes
Propriedades de Somatório
n
X n n
!2
1) k = nk
X X
5) (xi2 ) 6= xi
i=1 i=1 i=1
Xn n
X
2) kxi = k xi
n n
i=1 i=1 X 1X
n n 6) (xi − x̄) = 0, x̄ = xi
X X n
i=1 i=1
3) (xi ± k) = xi + nk
i=1 i=1
n
X n
X n
X n
X
4) (a ± bxi ) = na + b xi 7) (xi − x̄)2 = xi2 − nx̄ 2
i=1 i=1 i=1 i=1
Duas variáveis
Definition
O somátorio que depedende de x1 , . . . , xn e y1 , . . . , yn é definido
por:
Xn
xi yi = x1 y1 + x2 y2 + . . . + xn yn
i=1
n
X n
X
1) kxi yi = k xi yi
i=1 i=1
Xn n
X
2) (xi yi ± k) = xi yi ± nk
i=1 i=1
Xn n
X n
X
3) (axi ± byi ) = a xi ± b yi
i=1 i=1 i=1
Exemplo
Suponha que os parafusos que são utilizados em tomadas elétricas
são emabaldos em caixas rotuladas com 100 unidades. Em uma
construção, 10 caixas de um lote tiveram o número de parafusos
contados. Os valores encontrados foram:
98, 102, 100, 100, 99, 97, 96, 95, 99, 100
Qual o número médio de parafusos do lote?
Mod = 100
Exemplo
Suponha que os parafusos que são utilizados em tomadas elétricas
são emabaldos em caixas rotuladas com 100 unidades. Em uma
construção, 10 caixas de um lote tiveram o número de parafusos
contados. Os valores encontrados foram:
98, 102, 100, 100, 99, 97, 96, 95, 99, 100
Qual o número médio de parafusos do lote?
Mod = 100
Mediana
A mediana (Me ) é o valor que ocupa a posição central do conjunto
dos dados ordenados.
Dados Agrupados
Dados Agrupados
1, 0, 1, 5, 1, 0, 0, 1, 2, 1, 1, 1, 2, 3, 1, 0, 2, 0, 2, 0
Total de filhos ni ni xi
0 6 0
1 8 8
2 4 8
3 1 3
4 0 0
5 1 5
Total 20 24
x̄ =?????
Rendimentos Médios Xi ni fi Ni Fi
[3900 − 4400) 4150 1 0.031 1 0.031
[4400 − 4900) 4650 12 0.375 13 0.406
[4900 − 5400) 5150 12 0.375 25 0.781
[5400 − 5900) 5650 4 0.125 29 0.906
[5900 − 6400) 6150 3 0.094 32 1
Total 32 1
x̄ =?????
Dados Agrupados
Mediana
A mediana para dados agrupados é calculada da seguinte forma
n
2 − NMe −1
Me = LIMe + × αMe
nMe
Rendimentos Médios Xi ni fi Ni Fi
[3900 − 4400) 4150 1 0.031 1 0.031
[4400 − 4900) 4650 12 0.375 13 0.406
[4900 − 5400) 5150 12 0.375 25 0.781
[5400 − 5900) 5650 4 0.125 29 0.906
[5900 − 6400) 6150 3 0.094 32 1
Total 32 1
n
− NMe −1
2 32/2 − 13
Me = LIMe + × αMe = 4900 + × 500
nMe 12
Rendimentos Médios Xi ni fi Ni Fi
[3900 − 4400) 4150 1 0.031 1 0.031
[4400 − 4900) 4650 12 0.375 13 0.406
[4900 − 5400) 5150 12 0.375 25 0.781
[5400 − 5900) 5650 4 0.125 29 0.906
[5900 − 6400) 6150 3 0.094 32 1
Total 32 1
n
− NMe −1
2 32/2 − 13
Me = LIMe + × αMe = 4900 + × 500
nMe 12
Dados Agrupados
Moda
A moda para dados agrupados é calculada da seguinte forma.
∆1
Mo = LIMo + × αMo
∆1 + ∆ 2
Calcule a moda
∆1
Mo = LIMo + × αMo
∆1 + ∆ 2
12 − 6
= 2.01 + × 0.70
(12 − 6) + (12 − 9)
LR Nakamura Estatística ESALQ 51 / 67
Estatística
Estatística Descritiva
Medidas
Calcule a moda
∆1
Mo = LIMo + × αMo
∆1 + ∆ 2
12 − 6
= 2.01 + × 0.70
(12 − 6) + (12 − 9)
LR Nakamura Estatística ESALQ 51 / 67
Estatística
Estatística Descritiva
Medidas: Medidas de Posição
Medidas de Posição
São Utilizados como medidas de Posição:
Quartis
Decis
Percentis
Quartis
Dividem os dados em 4 conjuntos iguais (Q1 , Q2 , Q3 ). Q2
representa a mediana.
Decis
Dividem os dados em 10 conjuntos iguais (D1 , . . . , D9 ). D5 repre
senta a mediana.
Percentis
Dividem os dados em 100 conjuntos iguais (P1 , . . . , P99 ). P50
representa a mediana.
LR Nakamura Estatística ESALQ 52 / 67
Estatística
Estatística Descritiva
Medidas: Medidas de Posição
Percentis
O percentil Pi para dados não agrupados é definido como
(
x[i+1] , f > 0
Pi = x[i ] +x[i +1]
2 ,f = 0
As medidas de dispersão
São estatísticas descritivas que visam fornecer o grau de
variabilidade das observações em relação a um valor central
(geralmente a média aritmética).
São elas:
Amplitude
Amplitude Interquartílica
Variância
Desvio Padrão
Coeficiente de Variação
Amplitute
Desvios
di = xi k
ei = xi − x̄
Variância
Desvio Padrão
q
sx = sX2
Exemplo
Variância amostral
Desvio Padrão amostral
Pn Pn 2
Sabendo que: i=1 xi = 986 e i=1 xi = 97260
√
Seja s 2 e s = s 2 , a variância e desvio padrão, respectivamente,
então para dados agrupados temos que
k
!
2 1 X
2
s = ni (Xi − x̄)
n−1
i=1
Coeficiente de variação
Definição
O coeficiente de variação se define por
s
CV = × 100%
x̄
O coeficiente de variação é:
Gráficos de Dispersão
Boxplot
x̄
o *
Boxplot
Me
x̄
o *
Q1 Q3
Boxplot
Me
x̄
o *
Q1 Q3
IQR
Boxplot
Me
x̄
o *
Q1 Q3
IQR
1.5*IQR 1.5*IQR
3*IQR 3*IQR
Boxplot
Ponto Discrepante
Me
(outlier)
x̄
o *
Q1 Q3
IQR
1.5*IQR 1.5*IQR
3*IQR 3*IQR
Boxplot
0.7
14
0.9
0.6
0.8
0.5
12
0.4
0.7
10
0.3
0.6
0.2
8
0.5
0.1
0.4
6
0.0
Medidas de Simetria
Distribuição Simetrica
x̄ = Me = Mo
12
10
8
Frequency
6
4
2
0
6 8 10 12 14
x
30
25
20
Frequency
15
10
5
0