RP - Aula 01 - Probabilidade e Estatistica
RP - Aula 01 - Probabilidade e Estatistica
RP - Aula 01 - Probabilidade e Estatistica
1/
Agenda
● Probabilidade
● Probabilidade Condicional
● Variável Aleatória (VA)
● Operador Esperança
● VA Multidimensional
● Correlação e Covariância
2/
Probabilidade
● Modelo
● Representação de uma situação existente
● Explicar determinado comportamento, prevendo o
resultado de experimentos envolvendo tal situação.
● Matemático, físico, econômico, probabilístico....
● Modelos matemáticos
● Quando fenômeno observado tem propriedades
mensuráveis.
3/
Probabilidade
● Modelo determinístico
● Condições sob as quais um experimento é realizado
determinado o exato resultado desse experimento.
● Solução de um conjunto de equações especifica o
resultado do experimento.
● Modelo probabilístico
● Resultados variam, embora o experimento seja repetido
sob as mesmas condições.
● Possíveis resultados, faixa de resultados.
4/
Probabilidade
● Regularidade estatística
● Médias obtidas em longas sequências de repetições de
experimentos aleatórios tem o mesmo valor.
● Ex: Seleção de bola em urna com reposição.
● Resultado: um número do conjunto S = {0, 1, 2}
● Número de repetições: n
● Número de vezes que bola “k” é selecionada: 𝑁𝑘 𝑛
𝑁𝑘 𝑛
● Frequência relativa do resultado: 𝑓𝑘 𝑛 = 𝑛
5/
Probabilidade
● Probabilidade
● De acordo com a regularidade estatística:
𝑁𝑘 𝑛
● 𝑝𝑘 = lim
𝑛→∞ 𝑛
6/
Probabilidade
● σ𝐾
𝑘=1 𝑓𝑘 𝑛 = 1
7/
Probabilidade
8/
Probabilidade
● Experimentos aleatórios
● Resultado “varia de forma imprevisível” quando o
experimento é repetido sob as mesmas condições.
● Ex1: lançar moeda 3x. Anotar número de caras.
● Ex2: escolher número real ao acaso entre 0 e 1. Anotar.
9/
Probabilidade
● Espaço amostral
● S = Conjunto de possíveis resultados.
● Quando realizado um experimento aleatório, apenas um
resultado (amostra) ocorre.
● Resultado de um experimento aleatório: ξ
● Discreto: se for contável.
● Contínuo: se não for contável.
10 /
Probabilidade
● Evento
● Subconjunto de S que satisfaz determinadas condições.
● Ex1: Número de caras ≥ 2
● Ex2: Número selecionado é < 0.3
● Evento certo: próprio conjunto S
● Evento nulo: não contém resultado possível.
11 /
Probabilidade
● Probabilidade
● Número que indica o quão “provável” é a ocorrência de
um evento quando um experimento é realizado
● Lei de probabilidade
● Função/regra que associa um número a um evento
● E: experimento aleatório.
● A: evento.
● P[A]: probabilidade de A.
12 /
Probabilidade
● Axiomas e Corolários
● 0≤𝑃 𝐴 ≤1
● 𝑃 𝑆 =1
● 𝑃 ∅ =0
● 𝑃 𝐴∪𝐵 =𝑃 𝐴 +𝑃 𝐵 −𝑃 𝐴∩𝐵
● 𝑃 𝐴𝑐 = 1 − 𝑃[𝐴]
13 /
Probabilidade
14 /
Probabilidade
● Probabilidade Condicional
● Notação: 𝑃[𝐴|𝐵]
● “Probabilidade de um evento A, conhecida a
probabilidade do evento B”.
● “Probabilidade do evento A, dado que o evento B
ocorreu”.
𝑃[𝐴∩𝐵]
● 𝑃𝐴𝐵 = ,𝑃 𝐵 >0
𝑃[𝐵]
● 𝑃[𝐴 ∩ 𝐵] = 𝑃 𝐴 𝐵 . 𝑃 𝐵 = 𝑃 𝐵 𝐴 . 𝑃 𝐴
15 /
Probabilidade
● Probabilidade Total
● Considerando 𝐵1 , ... , 𝐵𝑛 eventos mutuamente exclusivos
● União destes eventos é o espaço amostral S
● Cada conjunto é uma partição do conjunto S
● 𝑃 𝐴 = 𝑃 𝐴 ∩ 𝐵1 + ⋯ + 𝑃 𝐴 ∩ 𝐵𝑛
● 𝑃 𝐴 = 𝑃 𝐴 𝐵1 . 𝑃 𝐵1 + ⋯ + ⋯ 𝑃 𝐴 𝐵𝑛 . 𝑃 𝐵𝑛
16 /
Probabilidade
● Eventos independentes
● Conhecimento do evento B não altera a probabilidade do
evento A.
𝑃[𝐴∩𝐵]
● 𝑃 𝐴 =𝑃 𝐴𝐵 =
𝑃[𝐵]
● 𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐴 .𝑃 𝐵
● 𝑃 𝐵 =𝑃 𝐵𝐴
17 /
Variáveis Aleatórias
● Definição
● Variável aleatória (VA) X: função que associa um número
real X(ξ) a cada resultado ξ do espaço amostral.
● Domínio da VA: S
● Imagem da VA: conjunto 𝑆𝑥 de todos os valores obtidos
para X.
● Ex1: lança 3x moeda, anota sequência.
● S = {ccc, cck...} X = número de caras obtidas
● 𝑆𝑥 = {0,1,2,3} (obs: pode ser um função identidade)
18 /
Variáveis Aleatórias
19 /
Variáveis Aleatórias
● VA Discreta
● Assume apenas valores discretos (contáveis)
● {0,1} ; {0, 0.1, ... , 2} ; “peso em gramas”.
● VA Contínua
● Valores pertencem a um intevalo contínuo.
● Peso, altura, temperatura, pressão...
20 /
Variáveis Aleatórias
21 /
Variáveis Aleatórias
22 /
Variáveis Aleatórias
● lim 𝐹𝑥 𝑥 = 0
𝑥→−∞
● 𝐹𝑥 𝑥 é não decrescente
● 𝐹𝑥 𝑥 é contínua à direita
● 𝑃 𝑎 < 𝑋 ≤ 𝑏 = 𝐹𝑥 𝑏 − 𝐹𝑥 𝑎
● VA Discreta: 𝐹𝑥 𝑥 = σ𝐾
𝑘=0 𝑃 𝑋 = 𝑥𝑘 𝑢(𝑥 − 𝑥𝑘 )
● 𝑃 𝑋 > 𝑥 = 1 − 𝐹𝑥 𝑥
23 /
Variáveis Aleatórias
24 /
Variáveis Aleatórias
● Binomial:
● Evento aleatório repetido “n” vezes
26 /
Variáveis Aleatórias
● Poisson
27 /
Variáveis Aleatórias
28 /
Variáveis Aleatórias
29 /
Variáveis Aleatórias
30 /
Variáveis Aleatórias
31 /
Variáveis Aleatórias
32 /
Medidas de Tendência Central e Dispersão
● Valor Esperado
● Esperança, Média...
● Variável Aleatória Discreta:
● Experimento foi realizado “N” vezes
● Frequência relativa: 𝑃 𝑋 = 𝑥𝑖 = 𝑛(𝑥
𝑁
𝑖)
, 𝑖 = 1, … , 𝑘
● Esperança de 𝑋: E 𝑋 = 𝑚𝑥
33 /
Medidas de Tendência Central e Dispersão
● Valor Esperado
● Variável Aleatória Contínua:
+∞
● 𝐸 𝑋 = 𝑚𝑥 = −∞ 𝑥𝑓 𝑥 𝑑𝑥
34 /
Medidas de Tendência Central e Dispersão
● Mediana
● “É o valor que separa a metade maior e a metade menor
de uma amostra, uma população ou uma distribuição de
probabilidade”.
● “Percentils”
● Ex1: {1, 3, 3, 6, 7, 8, 9}
● Ex2: {3, 5, 7, 9}
35 /
Medidas de Tendência Central e Dispersão
● Moda
● “A moda amostral de um conjunto de dados trata do
valor que ocorre com maior frequência ou o valor mais
comum em um conjunto de dados”
● Útil para observações ou valores não numéricos
● Amostras amodais, unimodais, bimodais, multimodais
36 /
Medidas de Tendência Central e Dispersão
● Moda
● “A moda populacional de uma distribuição de
probabilidade discreta é o valor x, em que a função
massa de probabilidade atinge o valor máximo”.
● “A moda populacional de uma distribuição de
probabilidade contínua é o valor x, em que a função
densidade de probabilidade atinge o valor máximo”.
37 /
Medidas de Tendência Central e Dispersão
38 /
Medidas de Tendência Central e Dispersão
● Média Geométrica
● “n-ésima raiz da multiplicação de n termos”
● Utilizada quando compara-se diferentes itens
(encontrando uma única "figura representativa" para
esses itens) quando cada um desses itens possuem
múltiplas propriedades que possuem diferentes escalas
numéricas.
● Ex: Comparação entre duas companhias.
● Escala de 0 a 5 para suas sustentabilidades ambientais;
● Escala de 0 a 100 para suas viabilidades financeiras;
39 /
Medidas de Tendência Central e Dispersão
● Média Harmônica
● “Quantidade de elementos do conjunto, dividido pela
soma do inverso dos elementos do conjunto.
● Utilizada quando se trabalha com grandezas
inversamente proporcionais. Tende para valores menores
● Ex: Velocidade média, escoamento de água, F-score...
● Comparação entre médias
● Maior: Aritmética; Menor: Harmônica;
● Geométrica: “mais balanceada”
40 /
Medidas de Tendência Central e Dispersão
● Medidas de dispersão
● “Qual a variabilidade de uma V.A. em torno da média?”
● Variância
● “É a média aritmética dos quadrados dos desvios
“(𝑥𝑖 −𝑚𝑥 )”, em relação à média, dos N resultados de um
experimento”.
● Variância
● V.A. Contínua:
● Ex2: Gaussiana: 𝜎 2
42 /
Medidas de Tendência Central e Dispersão
● Desvio Padrão
● “Medida de dispersão em torno da média populacional
de uma variável aleatória”.
● Utilizado para expressar outros conceitos importantes
● Coeficiente de correlaçao, coeficiente de variação...
● Utilizado para medir confiança em experimentos
estatísticos
43 /
Medidas de Tendência Central e Dispersão
● Momentos de ordem k
● Assimetria (Skewness)
● “Medida da assimetria da distribuição de probabilidade
de uma variável aleatória de valor real sobre sua média”.
● Pode ser zero, positiva ou negativa.
45 /
Medidas de Tendência Central e Dispersão
● Assimetria (Skewness)
● “Momento de ordem central 3 dividido pela desvio
padrão elevado ao cubo”.
● Curtose (Kurtosis)
● “É uma medida da "cauda" da distribuição de
probabilidade de uma variável aleatória de valor real”.
47 /
Medidas de Tendência Central e Dispersão
● Curtose (Kurtosis)
● “Momento de ordem central 4 dividido pela desvio
padrão elevado a 4ª potência”.
● Distribuição gaussiana: Kurtosis = 3
48 /
Variáveis Aleatórias Multidimensionais
49 /
Variáveis Aleatórias Multidimensionais
50 /
Variáveis Aleatórias Multidimensionais
51 /
Variáveis Aleatórias Multidimensionais
52 /
Variáveis Aleatórias Multidimensionais
53 /
Variáveis Aleatórias Multidimensionais
54 /
Variáveis Aleatórias Multidimensionais
● Resumidamente: 𝑥Ԧ ~ 𝑁(𝜇,
Ԧ 𝐶𝑥 )
55 /
Variáveis Aleatórias Multidimensionais
● 𝑄 𝑥Ԧ = 𝑥Ԧ − 𝜇Ԧ 𝑇 𝐶𝑥−1 (𝑥Ԧ − 𝜇)
Ԧ
● 𝑄 𝑥Ԧ = Distância de mahalanobis
56 /
Variáveis Aleatórias Multidimensionais
57 /
Variáveis Aleatórias Multidimensionais
58 /
Variáveis Aleatórias Multidimensionais
59 /
Variáveis Aleatórias Multidimensionais
60 /
Covariância e Correlação
● Covariância
● Para uma PDF de múltiplas variáveis, faz-se necessário
definir um momento estatístico que quantifique a
variação conjunta de duas variáveis aleatórias 𝑋𝑖 e 𝑋𝑗
quaisquer.
● A Covariância de 𝑋𝑖 e 𝑋𝑗 , 𝑖 ≠ 𝑗 é definida como:
● 𝑐𝑖𝑗 = 𝐸 𝑋𝑖 − 𝜇𝑖 𝑋𝑗 − 𝜇𝑗 , ∀𝑖, 𝑗
+∞ +∞
● 𝑐𝑖𝑗 = −∞ −∞ 𝑥𝑖 − 𝜇𝑖 𝑥𝑗 − 𝜇𝑗 𝑓𝑋𝑖𝑋𝑗 𝑥𝑖 , 𝑥𝑗 𝑑𝑥𝑖 𝑑𝑥𝑗
● Se 𝑖 = 𝑗: 𝑐𝑖𝑖 = 𝐸 𝑋𝑖 − 𝜇𝑖 2 = 𝜎𝑖2
61 /
Covariância e Correlação
● Correlação
● A correlação de 𝑋𝑖 e 𝑋𝑗 , 𝑖 ≠ 𝑗 é definida como:
● 𝑟𝑖𝑗 = 𝐸 𝑋𝑖 𝑋𝑗 , ∀𝑖, 𝑗
+∞ +∞
● 𝑟𝑖𝑗 = −∞ −∞ 𝑥𝑖 𝑥𝑗 𝑓𝑋𝑖 𝑋𝑗 𝑥𝑖 , 𝑥𝑗 𝑑𝑥𝑖 𝑑𝑥𝑗
● Obs: Covariância
● “Medida fraca de independência”. Se variáveis são
independentes, covariância é nula.
62 /
Covariância e Correlação
● Coeficiente de Correlação
● O coeficiente de correlação de 𝑋𝑖 e 𝑋𝑗 , 𝑖 ≠ 𝑗 é dado por:
𝑐𝑖𝑗 𝐸[(𝑥𝑖 −𝜇𝑖 )(𝑥𝑗 −𝜇𝑗 )]
● 𝜌𝑖𝑗 = = , ∀𝑖, 𝑗
𝜎𝑖 𝜎𝑗 𝜎𝑖 𝜎𝑗
● −1 ≤ 𝜌𝑖𝑗 ≤ 1
63 /
Covariância e Correlação
● Matriz de covariância
● As combinações 𝑐𝑖𝑗 , 𝑖 = 1, … , 𝑝, podem ser organizadas em
uma matriz de covariância:
● Matriz de covariância
● 𝐶𝑥 = 𝐸[(𝑥Ԧ − 𝜇)( Ԧ 𝑇]
Ԧ 𝑥Ԧ − 𝜇)
● 𝐶𝑥 = 𝐸 𝑥Ԧ 𝑥Ԧ 𝑇 − 𝜇Ԧ𝜇Ԧ𝑇 = 𝑅𝑥 − 𝜇Ԧ𝜇Ԧ𝑇
66 /
Covariância e Correlação
67 /
Covariância e Correlação
68 /
Processos Estocásticos
● Definição
● “Grosso modo, processo estocástico é uma generalização
do conceito de variável aleatória, em que uma segunda
componentes (em geral, a variável tempo) é utilizada na
caracterização de um evento ou experimento
probabilístico".
● Termos
● Determinístico x Estocástico (probabilístico)
● Aleatoriedade (Randomness); Incerteza (Uncertainty);
69 /
Processos Estocásticos
70 /
Processos Estocásticos
● Autocorrelação
● O conteúdo de frequências de um processo depende da
velocidade com que a amplitude muda com o tempo.
● Pode-se medir pela correlação entra amplitudes em:
● 𝑡1 e 𝑡1 + 𝜏
72 /
● Autocorrelação e autocovariância
● Autocovariância
● “É o momento conjunto central das V.A. 𝑋 𝑡1 e 𝑋 𝑡2 para
quaisquer (𝑡1 , 𝑡2 ).
73 /
Processos Estocásticos
74 /
Processos Estocásticos
● Ergodicidade
● Para processos ergódicos, as médias estatísticas podem
ser obtidas por meio de medias temporais realizadas a
partir de uma única função amostra, ou seja “ao longo”
do processo.
● A partir de um amostra, extrai-se estatísticas.
75 /
Processos Estocásticos
76 /