Análise Estatística
Análise Estatística
Objetivos
1) Entender a aplicação da estatística da área de gestão;
2) Identificar os métodos científico, experimental e estatístico;
3) Compreender as fases do método estatístico (coleta, crítica, apuração e apresentação e
análise dos dados);
4) Entender a necessidade da estatística nas empresas, conhecendo a sua importância no
processo de tomada de decisão em diversas áreas.
→ Métodos científicos
Os métodos são as trilhas que nos permite chegar a um objetivo, ou a um determinado
resultado, sendo um conjunto de passos e procedimentos que repetidos fornecem um
resultado específico. Dentre os métodos científicos destacamos o método estatístico e
experimental.
a. método experimental:
Quando se realiza um experimento e se deseja analisar como se comportam seus
resultados ao se alterar algum dos elementos componentes do experimento, é necessário
manter constante os demais fatores (causas). Pontos importantes:
b. método estatístico
- Através da análise estatística, é possível descrever a variabilidade e entender quais
as fontes mais importantes, ou quais as de maior potencial de influência na
variabilidade do fenômeno.
- Podemos dizer que a etapa que necessita de maior atenção e cuidado é o
planejamento de como o conjunto de dados será coletado. Um mau planejamento,
ou mesmo uma coleta feita de forma inapropriada pode acarretar em dados inúteis,
de onde não se consegue tirar nenhuma informação ou qualquer conclusão
coerente.
-
Aula 02- Revisão das medidas de tendência central e de posição
objetivo
1) Aprender a calcular as medidas de posição central e suas relações;
2) Conhecer as medidas de ordenamento quartis, decis e percentis;
3) Aprender a calcular as medidas estatísticas em Microsoft Excel.
→ medidas de posição
a. medidas de tendência central: moda, mediana, média aritmética e ponderada
b. separatrizes: quartis, decis e percentis
→ moda: o valor que ocorre com maior frequência, podendo ser: unimodal, bimodal
,plurimodal ou amodal. É usada quando temos distribuições extremamente assimétricas, ou
nas situações irregulares em que dois ou mais pontos de concentração de dados são
verificados na série de dados.
→ Medidas de assimetria
→ coeficiente de assimetria
x−M o
AS = S
AS = coef de assimetria
x = média
Mo = moda
s = desvio padrão da amostra ( σ quando for população)
→ separatrizes
a. quartis
b. Decis
c. Percentis
Aula 03- Revisão das medidas de dispersão
obejtivos
1. Aprender a calcular as medidas de dispersão com a ideia de amplitude total e
interquartil, desvio médio, variância e desvio padrão, bem como o coeficiente de
variação;
2. Aprender a calcular as medidas estatísticas em Excel
→ medidas de dispersão
a. amplitude total e interquartil
b. desvio médio
c. variância e desvio padrão
Desvio padrão
d. coeficiente de variação
→ Medidas de assimetria
A curva de uma distribuição simétrica tem por característica que o valor máximo
encontra-se no ponto central da distribuição. Desta forma os pontos equidistantes do centro
possuem a mesma frequência.
→ Coeficiente de curtose
Aula 06 - Probabilidade
objetivos:
1) Conhecer a definição de probabilidade e seus principais teoremas
2) Aprender o significado e aplicação dos eventos complementares, dos eventos
independentes, bem como dos eventos mutuamente exclusivos;
3) Entender a definição dos conceitos de experimento aleatório e de espaço amostral, assim
como suas finalidades, utilizações e aplicações no campo da teoria da probabilidade em
Estatística.
→ Experimento aleatório
É qualquer processo aleatório capaz de produzir observações e que possa se repetir
indefinidamente no futuro sob as mesmas condições. Um experimento aleatório apresenta
variações nos resultados, o que faz com que seus resultados a priori não sejam
determinados antes que tenham sido realizados. É possível, entretanto, indicar todos os
seus resultados possíveis, ou seja, as suas probabilidades. É na verdade qualquer processo
capaz de gerar um resultado incerto ou casual.
● Caracteríticas
○ cada experimento pode ser repetido indefinidamente sob as mesmas
condições
○ embora não se possa prever priori que resultados ocorrerão, pode-se
descrever o conjunto de resultados possíveis
○ à medida que se aumenta o número de repetições, surgirá certa regularidade
dos resultados, isto é, haverá uma estabilidade na ocorrência da frequência
relativa de um particular resultado.
→ Espaço amostral
É o conjunto que reúne todos os resultados possíveis para determinado experimento.
→ Probabilidade
O que não pode acontecer é confundir “chance” com “probabilidade”, pois existe certa
diferença entre eles. A chance compara a quantidade de resultados possíveis de A com os
resultados possíveis de outro evento (B ou C), enquanto que a probabilidade faz relação
entre os resultados possíveis de A com a quantidade total dos resultados possíveis do
experimento aleatório.
Em uma caixa com 7 bolas brancas, 3 azuis e 4 pretas, a probabilidade de retirar uma bola
branca é:
P (branca) = 7
14
Enquanto que a chance de retirar uma bola branca é 7:7, ou seja, a chance de retirar uma
bola branca é a mesma de retirar uma bola de outra cor.
→ Eventos complementares
Todo evento pode ocorrer ou não. Se uma evento possui uma probabilidade p de sucesso e
uma probabilidade de insucesso q, então para esse mesmo evento existe a relação
p+q=1→q=1-p
→ Eventos independentes
Dois eventos, A e B, são ditos independentes quando o fato de ter ocorrido B não altera a
probabilidade de ocorrer o evento A. Note, portanto, que P(A∩B) = P(A) x P(B)
→ Probabilidade condicional
P (A⋂B)
P (A/B) = P (B)
Exemplo: Entre vinte e cinco peças encontradas em uma caixa, nove estão com defeito,
seis tem somente pequenos defeitos e três apresentam maiores defeitos. Determine a
probabilidade de que uma peça selecionada aleatoriamente apresente maiores defeitos
dado que a peça tem defeitos.
P(B) = 9/25
P (A ⋂ B ) = 3/25
P(A/B) = (3/25)x(25/9) = 3/9
n(A⋂B)
* P (A ⋂ B ) = n → n (A ⋂ B ) = peça com defeito e grande
Aula 07- Distribuição Binomial
objetivos:
1- Aprender as formas de Distribuição Binomial, bem como as condições a serem satisfeitas
para que ela seja aplicada;
2- Aprender o conceito de variável e suas espécies (qualitativas e quantitativas).
→ Variáveis
● Quantitativas
○ Discretas
○ Contínuas
● Qualitativas
○ Ordinais: definem um ordenamento ou uma hierarquia. ex: posição das 100
empresas mais lucrativas
○ Nominais
→ Variáveis aleatórias
Com a distribuição binomial podemos determinar a probabilidade de obter k sucessos em n
tentativas
Exemplos:
http://estacio.webaula.com.br/cursos/gra256/docs/distribuicao_binomial.pdf
Aula 08- Distribuição Normal e Gráfico de Dispersão
objetivos:
1) Reconhecer a distribuição normal (curva de Gauss) e como usar suas propriedades nas
aplicações do dia a dia;
2) Aprender como estimar áreas sob uma curva normal e usá-las para calcular
probabilidades de variáveis aleatórias como distribuições normais;
3) Entender o diagrama de dispersão e suas formas de utilização.
→ Características
1. A curva normal tem forma de sino.
2 . É simétrica em relação à média.
3. Prolonga-se de - ∞ a + ∞
4. Cada distribuição normal fica completamente especificada por sua média e seu desvio
padrão; há uma distribuição normal distinta para cada combinação de média e desvio
padrão.
5. A área total sob a curva normal é considerada como 100%.
6 . A área sob a curva entre dois pontos é a probabilidade de uma variável normalmente
distribuída tomar um valor entre esses pontos.
7. Como há um número ilimitado de valores no intervalo de -oo a +oo, a probabilidade de
uma variável aleatória distribuída normalmente tomar exatamente determinado valor é
aproximadamente zero. Assim, as probabilidades se referem sempre a intervalos de
valores.
8 . A área sob a curva entre a média e um ponto arbitrário é função do número de desvios
padrões entre a média e aquele ponto.
Aula 09: Correlação e Regressão Linear
→ Correlação
Real:
“Mas, devo utilizar as distribuições marginais das linhas ou das colunas”?
Aí,depende do que você quer avaliar. No nosso caso, vamos fixar o total dos sexos como
100% e, com base nisso, encontrar quanto cada curso representa de matrículas por sexo.
Esperado:
No fundo, o que fizemos foi comparar a proporção marginal de cada curso com relação às
suas respectivas proporções associada a cada sexo. Assim, caso as variáveis não tivessem
nenhuma associação, esperar-se-ia que:
Entendeu? Se as variáveis não forem associadas, espera-se que 60% das pessoas
frequentarão cursos de Física e 40% cursos de Ciências Sociais, independentemente do
sexo. Se isso for verdade, basta aplicar estes percentuais no total de cada coluna que
encontraríamos os valores esperados de cada célula se as variáveis não fossem
associadas.
Sendo que esta expressão está te dizendo para somar, para todas as células ( ι, ι ), o
quadrado das diferenças entre o valor real (r ι, ι) ) e o valor esperado em cada célula (e ι, ι) ),
caso as variáveis não fossem associadas, divido pelo seu respectivo valor esperado.
Sendo n o tamanho da amostra.
→ Regressão
Ou seja, o exercício fornece o somatório das variáveis utilizadas na equação, mas sem
estarem centradas na média. Neste caso, você precisa decorar estas fórmulas, ok?
︿
Dado que, com base na nossa regressão estimada, o valor esperado de y ( y ) é:
︿
Y = a + bxi
Análise feita dentro do intervalo da reta chama-se interpolação, fora do intervalo chama-se
extrapolação.
Aula 10: Número índices
→ IGP
Calculado pela FGV . Indexador mais usado em em contratos de longo prazo.
→ Deflacionamento
Diminuição do seu poder de comprar comparado a um índice, por exemplo, de preço.