Introducción A La Probabilidad

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 34

§Anteriormente hemos hablado de muestras y de

población. De estimadores y de parámetros.


§Los estimadores muestrales nos aproximan a lo
que en teoría debería de encontrarse en una
población (parámetros).
§La distribución de frecuencias (o distribución
empírica) de una variable viene dada por los
posibles valores que tiene una variable en una
muestra.
§La distribución de probabilidad sería el
conjunto de todos los valores que teóricamente
podría tomar dicha variable.
§¿Qué es realmente la probabilidad?

§Es la medida de certidumbre de que ocurra un


suceso.
§ Una de las características de los seres humanos es
nuestra capacidad de predicción.
§Intentamos continuamente anticiparnos a los
peligros.
§ A veces fallamos, pero muchas otras veces no.
§Regla de Laplace. El gordo de navidad
Lotería de Navidad: Entran en el bombo100.000 números
(desde el número 0 al 99.999)

Regla de Laplace
!"#$# &"'$(")*+# .
P(Ganar el gordo)= = = 0.00001
!"#$# ,$#-)*+# .//.///
§Regla del producto. La primitiva (I)
La Primitiva: Consiste en elegir 6 números del 1 al 49, además de otro número
complementario y uno distinto del 0 al 9 para determinar el reintegro.
Probabilidad de acertar los 6 números:
!"#$# &"'$(")*+# 1
P(acertar el primero)= !"#$# ,$#-)*+# = 23 = 0.1224
4
P(acertar el segundo)= = 0.1042
25
2
P(acertar el tercero)= 26 = 0.0851
7
P(acertar el cuarto)= 21 = 0.0652
8
P(acertar el quinto)= 24 = 0.0444
.
P(acertar el sexto)= = 0.0227
22
§Regla del producto. La primitiva (II)
Probabilidad de acertar los 6 números:
P(acertar los seis)=
P(acertar 1º y acertar 2º y acertar 3º y acertar 4º y acertar 5º y acertar 6º)

! $ " ' ( ) )
= ∗ ∗ ∗ ∗ ∗ =
"# "% "& "! "$ "" )'.#%'.%)!

= 0.00000007
Al tercer presidente de los Estados
Unidos, Thomas Jefferson, se atribuye la frase que
reza: “Las loterías son un impuesto del gobierno al
desconocimiento de las matemáticas”.
§Falacia del jugador:
Creer, erróneamente, que los sucesos pasados afectan a los futuros
en lo relativo a actividades aleatorias.
§ Este año el gordo tiene que terminar en 1 porque hace mucho que esa
terminación no sale.
§ Jugar a unos número fijos porque tarde o temprano tienen que salir. La
probabilidad de ganar en la lotería jugando siempre el mismo
número es la misma que jugando un número diferente cada vez:
las probabilidades solo dependen de los números en juego.
§ Se piensa que si una administración de lotería ha vendido el
número agraciado va a atraer a la suerte y tiene más probabilidad
de que lo vuelva a vender.
§ Probabilidad del suceso complementario. La paradoja del
cumpleaños:
¿Cuál es la probabilidad de que en un grupo de 23 personas
al menos dos de ellas celebren su cumpleaños el mismo día?
Calculamos la probabilidad de que NO compartan cumpleaños (todas las personas que
están en la habitación tienen una fecha de cumpleaños diferente):

712 712 717


2 personas: prob= =0.9973 3 personas: prob= = 0.9918
714 714 714
712 717 727
23 personas: prob= ⋯ = 0.493
714 714 714

Hay un 49.3% de posibilidades de que todos los de la habitación tengan fechas de


cumpleaños diferentes y, a la inversa, hay un 100%-50.7% de posibilidades de que al
menos 2 compartan fecha de cumpleaños.
§ Probabilidad del suceso complementario. La paradoja del
cumpleaños (II):
§ Solo necesitamos 23 personas para que dos de ellas coincidan
en el día de su cumpleaños con una probabilidad mayor del
50%.
§ Para 60 o más personas la probabilidad es mayor del 99%.
§ ¿Cuál es la probabilidad de que si entramos en una
habitación con 23 personas alguna comparta la fecha de
cumpleaños conmigo?
!"# %!
1− =0.061 (6.1%)
!"$
§ Probabilidad condicionada. Teorema De la probabilidad
total. El problema de Monty Hall:
El concursante escoge una puerta entre tres, y su premio consiste en lo que se
encuentra detrás. Una de ellas oculta un coche, y tras las otras dos hay una
cabra. Sin embargo, antes de abrirla, el presentador, que sabe donde esta el
premio, abre una de las otras dos puertas y muestra que detrás de ella hay una
cabra. Ahora tiene el concursante una última oportunidad de cambiar la puerta
escogida
¿Debe el concursante mantener su elección original o escoger la otra
puerta?
¿Cuál sería la opción correcta?
a) Quedarse con la puerta inicial

b) Cambiar a la otra puerta

c) Es irrelevante cambiar o no cambiar


NO CAMBIA CAMBIA

CASO 1

CASO 2

CASO 3
A B
G

A=El jugador selecciona la puerta que contiene el coche en su selección inicial: P(A)=1/3
B=El jugador selecciona la puerta que contiene una cabra en su selección inicial: P(B)=2/3
Ganar=Ganar el coche
Teorema de la probabilidad total: P(Ganar)=P(Ganar/A)*P(A)+P(Ganar/B)*P(B)
. 8 .
NO CAMBIA DE PUERTA: P(Ganar)=1* + 0* =
7 7 7

. 8 𝟐
CAMBIA DE PUERTA: P(Ganar)=0*7 + 1* 7 = 𝟑
§ Teorema de Bayes. Probabilidad condicionada.
Podemos calcular la probabilidad de un suceso A, sabiendo además
que ese A cumple cierta característica que condiciona su
probabilidad.

El teorema de Bayes entiende la


probabilidad de forma inversa al
teorema de la probabilidad total. El
teorema de la probabilidad total hace
inferencia sobre un suceso B, a partir
de los resultados de los sucesos A.
Por su parte, Bayes calcula la
probabilidad de A condicionado a B.
§ Teorema de Bayes. Probabilidad condicionada (II).
§ Ejemplo: Un hospital dispone de dos máquinas (1 y 2) que
realizan el mismo test, una realiza el 40% (1) de los test y otra
realiza el 60% (2) de los test. El porcentaje de test defectuosos
que puede presentar cada una es de 2% (1) y del 3% (2), si
seleccionamos al azar un test y resulta que es defectuoso ¿Cuál es
la probabilidad de que haya sido realizado por la máquina 1?
§ Teorema de Bayes. Probabilidad condicionada
(II).Ejercicio: Tenemos dos bolsas. En una primera bolsa
hay 3 bolas negras y 4 blancas, y en una segunda bolsa
hay 3 bolas blancas y 5 negras. Si sacamos una bola de la
bolsa 1 y la introducimos en la bolsa 2, ¿Calcula la
probabilidad de que la bola extraída en la primera bolsa
es blanca, si sabemos que la bola extraída de la
segunda bolsa es blanca?
§ Teorema de Bayes. Falsos Positivos
§ Teorema de Bayes. Falsos Positivos

Supongamos que nos realizamos un test para detectar una enfermedad. El test
es increíblemente preciso:

• Si tiene la enfermedad, lo detecta correctamente el 99% de la veces


(sensibilidad del test)
• Si NO tiene la enfermedad, lo dirá correctamente el 99% de la veces
(especificidad del test)

El test nos da positivo ¿cuál es la probabilidad de que realmente tengamos la


enfermedad?
§ Teorema de Bayes. Falsos Positivos (I)
Sensibilidad test=P(dar positivo/está enfermo)=0.99
Especificidad del test=P(dar negativo/ no está enfermo)=0.99

Nº test realizados 1.000.000

100 999.900
P(enfermedad)=1/10.000 enfermos sanos

Sensibilidad=0.99 99 tests 1 test 9.999 tests 989.901


positivos negativo positivos tests
Especificidad=0.99 negativos

Nº total de test positivos=99+9.999=10.098


𝟗.𝟗𝟗𝟗
Prob de no estar enfermo sabiendo que el test es positivo=𝟏𝟎.𝟎𝟗𝟖=0.99 (99%)
§ Teorema de Bayes. Falsos Positivos (II)
Sensibilidad test=P(dar positivo/está enfermo)=0.99
Especificidad del test=P(dar negativo/ no está enfermo)=0.99

Nº test realizados 1.000.000

10.000 990.000
P(enfermedad)=1/100 enfermos sanos

Sensibilidad=0.99 9.900 tests 100 test 9.900 tests 980.100


positivos negativo positivos tests
Especificidad=0.99 negativos

Nº total de test positivos=9900+9.900=19.800


𝟗.𝟗𝟎𝟎
Prob de no estar enfermo sabiendo que el test es positivo=𝟏𝟗.𝟖𝟎𝟎=0.5 (50%)
§ Teorema de Bayes. Falsos Positivos (III)

La influencia de los falsos positivos y falsos


negativos en la certeza de una prueba
diagnóstica disminuye conforme la
enfermedad evaluada comienza a propagarse
entre más personas.
§ PARADOJA DE SIMPSON
§ Informe sobre coronavirus publicado por el Public Health
England (PHE, 25/6/21).
§ Incluye una tabla con datos sobre los pacientes infectados
con la variante delta que, del 1 de febrero de 2021 al 21 de
junio de 2021, fallecieron. Se clasifican en función de si el
paciente estaba o no vacunado.

No vacunados Fallecen 44
53822 44 = 0.0008
53822
Total personas
Infectadas
61057
Vacunados Fallecen !"
= 0.0069
7235 50 #$%!
§ PARADOJA DE SIMPSON (II): ocurre cuando al analizar
grupos de datos de forma conjunta se producen resultados
diferentes o contrarios que al analizarlos por subgrupos.
§ Variable confusora: factor que tiene mucho peso dentro de los
datos y desequilibra la balanza cuando estos se analizan de forma
agregada, llevando a resultados engañosos: EDAD
Total personas Artículo en España Total personas
Infectadas Infectadas
MAYORES 50 AÑOS MENORES 50 AÑOS
4522 56535

No vacunados Vacunados No vacunados Vacunados


976 3546 52846 3689

Fallecen Fallecen Fallecen Fallecen


38 50 6 0
!" &' %
= 0.00011 0
= 0.039 = 0.014 &)"(% =0
#$% !&(% 3689
§ Si lanzamos infinitas veces una moneda al aire
esperamos obtener un 50% de cruces (Distribución
de probabilidad).
§Sin embargo si la lanzamos 20 veces obtendremos
quizá 7 caras y 13 cruces (Distribución empírica).
§Asumimos que si la lanzamos muchas veces la
moneda, la distribución empírica se aproximará a la
distribución de probabilidad.
§En estadística inferencial se asume con frecuencia
que una muestra procede de una población que
sigue una determinada distribución teórica de
probabilidad.
§Si utilizamos un método estadístico asumiendo
que los datos de una muestra pertenecen a una
población con una distribución teórica conocida
se dice que dicho método es paramétrico.

§Las distribuciones teóricas de probabilidad más


usadas son la distribución binomial o la de
Poisson para variables categóricas, y la
distribución normal o de Gauss para
variables numéricas (cuantitativas).
§Distribución normal (I):
§ Ejemplo: Imaginemos que lanzamos dos dados simultáneamente
1.000 veces y se suman las cantidades.
§ Los resultados empíricos podrían ser estos:
§Distribución normal (II):
§¿Cómo podría obtener la probabilidad?
§Distribución normal (III):
§¿Qué ocurriría si aumentáramos los dados de 2 a
5?
§Distribución normal (IV):
§¿y si siguiéramos aumentando el número de
dados y lanzamientos?
§ Distribución normal (V):
§ En general, una distribución normal se caracteriza por:
1. Tener forma de campana.
2. Ser simétrica (asimetría = 0).
3. No ser excesivamente plana ni excesivamente picuda
(mesocúrtica).
4. Coincidir en ella la media, la mediana y la moda.
5. Tener aproximadamente el 95% de sus valores dentro del
intervalo μ ± 2 σ (media ± 2 desviaciones estándar).
Exactamente, el 95% de los individuos se encuentra dentro del
intervalo comprendido por μ ± 1,96 σ. Además, casi el 100%
de los valores está dentro del intervalo μ ± 3 σ.
6. Ser la distribución muestral que siguen los índices o
estimadores estadísticos calculados en una muestra. Esto es lo
más importante.
§ Distribución normal (VI):
§ Curiosamente, y a pesar de su nombre existen muchas
variables biológicas que no siguen una distribución normal.
§ Lo más frecuente, especialmente en medicina clínica, es que las
variables no se adapten perfectamente al modelo teórico
matemático de la distribución normal.
§ Esto no es un problema para la inferencia, debido al Teorema
Central del Límite:
§ Si tenemos una muestra que contiene muchas observaciones,
cada observación se genera aleatoriamente de forma que no
depende de los valores de las demás observaciones, y que se
calcula la media aritmética de los valores observados. Si este
procedimiento se realiza muchas veces, el teorema dice que
la distribución de probabilidad de la media se aproximará
mucho a una distribución normal.
§ Distribución normal (VII):

§ Existen diferentes pruebas o test que permiten saber si los


valores de una variable siguen una distribución normal.

§ Estos test funcionan muy bien para tamaños de muestra


intermedios n=20 y n=200

§ Ejemplos más comunes de estos test son:


§ Test de Shapiro-Wilk.
§ Test de Lilliefors.
§ Test de Kolmogorov-Smirnov.

También podría gustarte