Unidad Nro.4 - Probabilidades
Unidad Nro.4 - Probabilidades
Unidad Nro.4 - Probabilidades
PROBABILIDADES
1
un naipe de un mazo de cartas, no se garantiza que en ese intento obtengamos un
resultado concreto y, por lo tanto, el resultado puntual será incierto. La teoría de las
probabilidades tendrá por objetivo tratar de asignar un número que trate de precisar,
con el mayor grado de rigor y cuidado posible, el grado de ocurrencia del fenómeno que
intentamos explicar. De esta manera, si pretendemos arrojar un dado y deseamos
calcular la probabilidad de obtener un cuatro como resultado previo a su lanzamiento,
la probabilidad asignada al cuatro (como una de las seis posibilidades) será el grado de
certeza máxima que disponemos para que dicho número efectivamente ocurra un
instante antes de su lanzamiento. Por lo tanto, vamos a definir a la probabilidad en un
sentido muy aproximado, como una “medida de la creencia de que un evento futuro
pueda ocurrir”. Está claro que una vez lanzado y verificado lo que se obtuvo, el resultado
será “Éxito= Haber obtenido el cuatro” o “Fracaso= No haber obtenido el cuatro”. En
consecuencia, sólo tiene sentido hablar de probabilidad antes que se conozca el resultado
del experimento ya que, una vez que el mismo se consumó, estaremos en presencia
simplemente de un resultado categórico binario.
2
Ejemplos:
4. Los espacios muestrales pueden ser también infinitos, pero contables. Tal sería el caso
de una inspección en un depósito extrayendo sucesivamente artículos hasta encontrar
un artículo defectuoso. Entonces, el espacio muestral estaría definido así:
S = D, ND, NND, NNND,... Caso 4: (S) Calidad de un lote de artículos hasta encontrar
un defectuoso.
5. Cuando los espacios muestrales involucran una cantidad infinita o muy grande de
puntos lo cuáles no se pueden contar taxativamente, el espacio muestral se representa
a través de una regla o enunciado:
3
4. Los espacios muestrales pueden ser: finitos, infinitos contables e infinitos,
estos últimos definidos a partir de reglas o enunciados.
Pensemos ahora en el caso de arrojar dos dados (como resultado del primer
experimento) y dos monedas (en el segundo caso). ¿Cómo deberíamos presentar al
espacio muestral? Al utilizar dos componentes experimentales el gráfico mediante una
sola dimensión (la recta) nos resultará restrictivo. Por tal motivo, utilizamos un diagrama
del tipo cartesiano que denote las dos dimensiones necesarias. El gráfico 4.2., muestra
ambas situaciones:
4
Ya cuando se trabaja con más de dos instrumentos experimentales, la organización del
espacio muestral se complica. En estos casos puede resultar muy útil utilizar los
“diagramas de árbol”, en el cual podemos contar e identificar los puntos muestrales de
una manera bastante clara. Veamos el caso, por ejemplo, de la inspección de tres artículos
respecto a su calidad, detallado en el ejemplo 1, como caso 3. Para contar cada uno de
los puntos muestrales y definir así el espacio muestral completo, procedemos a realizar
un control secuenciado en forma de árbol a partir del primer artículo inspeccionado.
Sobre los nodos terminales del árbol determinamos cada uno de los puntos del espacio.
5
Ejemplo 1. Una concesionaria automotriz comercializa varias marcas de autos
cuyos segmentos son: Familiar, utilitarios, convertibles y pick up. Cada uno de
los automóviles pueden ser clasificados (de acuerdo a su aprovisionamiento de
combustible) en: Diesel, híbrido y naftero. ¿En cuántas categorías diferentes se
pueden clasificar las marcas comercializadas?
6
Generalización de la regla de la multiplicación: Si una primera etapa de un
experimento estadístico admite n1 formas posibles de presentarse y, n2 en una
segunda etapa, n3 en una tercera y, así sucesivamente,.. entonces el experimento
estadístico realizado en “k” secuencias o etapas admite n1.n2… nk resultados
posibles.
N = n1.n2 ....nk
Cada punto del espacio muestral, vendrá definido por el orden de ingreso. Así:
N = 3! = 3.2.1.0! = 6
Si nos tomáramos el trabajo de enlistar los puntos que integran el espacio, estos
serían:
S = (1, 2,3);(1,3, 2);(2,1,3);(2,3,1);(3,1, 2); (3, 2,1)
7
n!
Su fórmula queda indicada por: Prn =
(n − r )!
40! 40!
N = Prn = = = 40.39.38 = 59.280
(40 − 3)! 37!
Ejemplo 2. Este ejemplo es un poco más avanzado del uso de las permutaciones
de n objetos tomados de a “r”. Imaginemos el caso de un consorcio de edificio
en el cual se desea elegir un presidente y un vocal. El edificio cuenta con 64
departamentos (4 departamentos de 2 ambientes en 16 pisos), todos
propietarios. Cuántas opciones tenemos disponibles para conformar la
conducción si:
a. No hay restricciones.
b. El propietario del 1C sólo participará si es presidente.
c. 6A y 6B participan si entre ellos mantienen la conducción.
d. 1D y 2D, por conflictos personales entre ellos, deciden no
participar juntos.
Caso a.) Es el caso más simple consistente en estudiar todos los posibles
grupos diferentes de a 2, tomados de 64. Entonces:
64! 64!
P264 = = = 64.63 = 4.032
(64 − 2)! 62!
Caso b.) Hay dos situaciones para estudiar: Por un lado, elegido 1C como
presidente, quedan 63 posibilidades para conformar el cargo de
vocal y, por el otro, elegir otras combinaciones o duplas posibles
en la que 1C y sus pretensiones no se tengan en cuenta.
Entonces tenemos: 63 (si 1C es presidente) + P263 = 3.906 (Si a 1C
no se lo tiene en cuenta). Por lo tanto: N = 3.906 + 63 = 3.969
8
P262 = 3.782 , entonces la respuesta a este inciso será:
N = 2 + 3.782 = 3.784
Caso d.) Hay dos posibilidades que se pueden dar para que 1D y 2D se
presenten juntos. Por lo tanto, las debemos deducir del total de
combinaciones posibles. Por lo tanto:
N = P264 − 2 = 4.032 − 2 = 4.030
N = (n − 1)!
n n!
N = =
n1 , n2 ,..., nk n1 !.n2 !...nk !
Ejemplo 1. Una guirnalda está conformada por 12 piezas, las cuáles presentan 3
colores distintos por componente: Verde (5), Amarillo (3), Rojo (4). ¿De cuántas
maneras distintas se pueden confeccionar las guirnaldas?
12 12!
N = = = 27.720
5,3, 4 5!.3!.4!
9
formas posibles puedo combinar los números de las bolas siguiendo esta
partición? Es importante tener presente en este caso que, una vez asignada la bola
al grupo, no interesa el orden o posición que guarda en él.
8 8!
N = = = 420
4, 2, 2 4!.2!.2!
n n n!
Cnr = = =
r ,(n − r ) r r !(n − r )!
5 5! 120
C53 = = = = 10
3 3!.(5 − 3)! 6.2
8 8! 40,320
C85 = = = = 56
5 5!.(8 − 5)! 120.6
N = 10.56 = 560
Ejemplo 2. ¿Cuántos arreglos posibles de letras se pueden realizar con las letras
de la palabra “BANANA” y, si fuera la palabra, “STATISTICS”
6 6!
Con BANANA → = = 60
1, 2,3 1!.2!.3!
10
10 10!
Con STATISTICS → = = 50.400
3,3, 2,1,1 3!.3!.2!.1!.1!
Habremos notado que esta forma de presentar los eventos sólo resulta válida cuando
trabajamos sobre espacios muestrales finitos o discretos. ¿Cómo proceder cuando
trabajamos con espacios muestrales infinitos o continuos, dado que no podemos enlistar
todos los puntos muestrales? Veamos un ejemplo. Nuestro experimento aleatorio
consiste en sembrar una cantidad determinada de semillas de tomates y medir luego de
40 días la altura de los plantines. Nuestro evento en estudio será identificar los plantines
que midan entre 8 y 12 cms de altura. Entonces:
11
Los eventos o sucesos se clasifican en simples o compuestos: Un evento es elemental o
simple cuando el mismo involucra directamente puntos muestrales, que no pueden
descomponerse en otros. Dicho de otra forma: Un evento simple Ei se incluye en el
evento A, si y sólo si A ocurre siempre que ocurra Ei. Un evento compuesto, por el
contrario, es aquel que puede descomponerse en sucesos simples.
A partir de cómo se comportan A, B, C,…. dentro del conjunto S, podríamos definir unas
cuántas propiedades, conocidas con el nombre de reglas o propiedades de los conjuntos.
Ei A Ei pertenece al Evento A
B A si y sólo si: ( Ei B Ei A , i B )
12
Está claro a partir de la visualización del diagrama anterior que A presenta otros
puntos, tales como Ej, los cuáles son propios de ese conjunto, pero no de B.
A= B B A y A B
13
Como apreciamos del diagrama, hay puntos que siguen siendo exclusivo de un
solo conjunto (como, por ejemplo, Ea). También hay puntos que son exclusivos
de la vinculación sólo de dos conjuntos (como en A y B, Ek). Y también podemos
observar puntos muestrales como Ew que pertenecen a los tres conjuntos
simultáneamente.
8. Principio del tercer excluido. Este principio dice que el complemento del
complemento de un conjunto resulta en el conjunto original.
( A´)´= A
14
9. Conmutatividad de la unión de conjuntos. Los conjuntos son conmutativos
respecto a la unión o suma.
A B = B A
A B = B A
A B C = A ( B C ) = ( A B) C
A B C = A ( B C ) = ( A B) C
( A B) C = ( A C ) ( B C )
( A B) C = ( A C ) ( B C )
15. Primer uso del complemento. Es una propiedad muy importante que le daremos
bastante uso en el estudio de la probabilidad y dice que un evento que se dan
concomitantemente con otro puede presentarse de la siguiente manera:
B = ( A B ) ( A´ B )
15
El objetivo de esta propiedad es describir todos los puntos muestrales
pertenecientes a B relacionando dicho conjunto a partir de la relación que tiene
con A. El conjunto B se integra por dos subconjuntos: El área sombreada (los
puntos muestrales Ei que son B y que también son A) y los puntos muestrales Ej,
que son puntos exclusivos de B (que claramente no pertenecen a A).
16. Segundo uso del complemento. La unión de dos conjuntos puede expresarse
también como:
A B = A ( A B)
( A B) = A B
16
18. Segunda ley de Morgan. Su objetivo es encontrar una expresión equivalente para
el complemento de la unión entre de dos o más conjuntos.
( A B) = A B
En el diagrama:
17
S = 1, 2,3, 4,5,6 A = 2, 4,6 A = 1,3,5
k
( A1.A2 ...Ak ) o bien A= Ai
i =1
Se llama suceso o evento “unión incluyente” a aquel suceso que ocurre cuando
se verifica el cumplimiento de alguno de sucesos o eventos que integran el
espacio muestral.
18
En términos del diagrama (para dos eventos):
Como podemos apreciar del gráfico, cumplen esta condición todos los puntos
muestrales que pertenezcan al evento A, al B o a ambos. Formalmente:
A B = ( A B) o ( A B) o ( A B)
(Sólo A) (Sólo B) (Ambos)
Si el espacio muestral está formado por “k” sucesos A (A1, A2,…, Ak), el suceso
unión incluyente se define como:
k
( A1 A2 ... Ak ) o bien A= Ai
i =1
19
En términos del diagrama (para dos eventos):
Como podemos apreciar del gráfico, cumplen esta condición todos los puntos
muestrales que pertenezcan al evento A o bien al B (excluyendo la posibilidad
que se presenten ambos al mismo tiempo). Formalmente:
AB = ( A B) o ( A B)
(Sólo A) (Sólo B)
Si el espacio muestral está formado por “k” sucesos A (A1, A2,…, Ak), el suceso
unión excluyente se define como:
k
( A1 A2 ...Ak ) o bien A= Ai
i =1
En el ejemplo del dado, la unión incluyente entre el suceso A y el B, quedaría
definido:
Vamos a decir que dos o más sucesos son “compatibles” si es posible que los
mismos puedan presentarse de manera conjunta. Necesariamente, dos o más
sucesos serán compatibles si tienen algún tipo de solapamiento, es decir,
comparten elementos del espacio muestral.
20
6. Sucesos o eventos “Incompatibles o mutuamente excluyentes”
21
4.5.- UN MODELO DISCRETO COMO APROXIMACIÓN A LA
DEFINICIÓN AXIOMÁTICA DE LA PROBABILIDAD
Por lo tanto,
P( A) 0
P( S ) = 1
Entonces:
Si A1, A2, A3,…. forman una secuencia de eventos por pares mutuamente
excluyentes en S, es decir:
Ai Aj = si i j
Entonces:
P( A) = P( A1 A2 A3 ...) = P( Ai )
i =1
22
Esta última propiedad es válida para los todos los eventos simples que
conforman el espacio muestral (es decir, para los puntos muestrales) y para
aquellos conjuntos a partir de ellos (los eventos) que cumplan con la propiedad
de ser mutuamente excluyentes de a pares.1
En consecuencia:
1
Observemos el límite superior de la sumatoria: Infinito. Se trata del caso general donde una sucesión
infinita de eventos mutuamente excluyente de pares, definen un evento. Pero también es perfectamente
válida para casos finitos, donde en este caso, tendríamos:
n
P( A1 A2 ... An ) = P( Ai )
i =1
23
Paso 1) Asignación de las probabilidades. Teniendo en cuenta que el dado es simétrico
y contamos con 6 puntos muestrales, la asignación individual de la
probabilidad para cada uno de los puntos será de 1/6
P( A) = P( E2 E4 E6 ) = P( E2 ) + P( E4 ) + P( E6 ) = 1/ 2
P( B) = P( E1 ) = 1/ 6
P(C ) = P( E1 E2 E3 ) = 1/ 2
P (W ) = P ( A B ) = P ( A) + P ( B ) = 1/ 2 + 1/ 6 = 2 / 3
P(V ) = P( E1 ) + P( E2 ) + P( E3 ) + P( E4 ) + P( E6 ) = 5 / 6
Observación importante: Los eventos simples (es decir, los puntos muestrales) son
necesariamente mutuamente excluyentes entre sí. Es decir que, en esta situación,
agregarlos en eventos compuestos para obtener la probabilidad correspondiente
no es un problema. La dificultad surge cuando la definición se aplica a partir de
eventos compuestos.
24
Ejemplo 2: Definición axiomática de probabilidad aplicado a un problema logístico
Una empresa dispone de 5 camionetas de reparto, 3 de las cuales están equipadas con
sistema de refrigeración. Si un cliente de la empresa realiza en la semana dos pedidos de
mercadería (sabiendo que una camioneta no puede ser utilizada para un mismo cliente
y que no interesa el orden del reparto)
5 5!
C52 = = = 10
2 3!.2!
S = E1 , E2 , E3 , E4 , E5 , E6 , E7 , E8 , E9 , E10
A = E8 , E9 , E10
25
Punto 4. Como no hay razones para suponer cómo se entregarán los envíos, todos los
puntos muestrales son igualmente probables. Entonces:
P( Ei ) = 1/10 i = 1, 2,...,10
P( A) = P( E8 ) + P( E9 ) + P( E10 ) = 3 /10
Los dos ejemplos anteriores se fundamentaron en que los puntos muestrales tenían la
misma probabilidad de ocurrencia. Cuando esta situación ocurre decimos que los
sucesos son simétricos. La definición axiomática de probabilidad permite también ser
aplicada a casos no simétricos. Este ejemplo lo extraemos literalmente de Mendenhall.
Se trata de partido de tenis entre dos participantes A y B. Las probabilidades son dos a
uno de que A gane cuando juegue versus B, dado su nivel de entrenamiento. Suponiendo
que A y B jueguen dos partidos de tenis. ¿Cuál es la probabilidad que A gane, al menos
1 partido?
26
E2 = ( A, B) A gana el primer partido, B el segundo
E3 = ( B, A) B gana el primer partido, A el segundo
E4 = ( B, B) B gana el primer y segundo partido
Si los resultados de los partidos son independientes uno de otro, diremos que la
asignación de probabilidades para cada uno de los puntos será:
P( E1 ) = 4 / 9 P( E2 ) = 2 / 9 P( E3 ) = 2 / 9 P( E4 ) = 1/ 9
Observamos así que las probabilidades de cada uno de los puntos son distintas
que, son positivas, menores a la unidad y su suma es uno.
4
4 2 2 1
P(S ) = P( E4 ) = + + + =1
i =1 9 9 9 9
4 2 2 8
P (C ) = P ( E1 ) + P ( E2 ) + P ( E3 ) = + + =
9 9 9 9
27
eventos simples del espacio muestral, sobre qué supuestos edifican sus teorías y cuáles
son sus mayores críticas.
Diremos:
A : Suceso Aleatorio de S
( A) : Cantidad de casos favorables al suceso A
( A) : Cantidad de casos contrarios a la ocurrencia del suceso A
N : Número total de casos posibles
Está claro que teniendo en cuenta la forma en que hemos definido ( A) y ( A) , la suma
de ambos deberá ser igual al total de los casos posibles.
( A) + ( A) = N
Por ejemplo, si quisiéramos obtener la probabilidad de cara al arrojar una moneda, o sea
P ( A) , tendríamos dos casos posibles (cara y ceca) y uno favorable (cara), de modo que
la probabilidad de A es igual al cociente correspondiente: 1/2. Análogamente, la
probabilidad de obtener As al arrojar un dado será 1/6 y la probabilidad de sacar figura
de un mazo de 40 cartas españolas será 12/40.
En cierto sentido, siguiendo con la definición clásica de probabilidad los límites 0-1
estrictamente no configuran una probabilidad, ya que no tendría sentido hablar de
sucesos aleatorios cuando los mismos resultan “imposibles” o “ciertos”. En efecto, tanto
la certeza como la imposibilidad son situaciones susceptibles de predicción categórica.
2
En “Teoría analítica de las probabilidades”, 1812
28
De manera que entre estos dos límites (imposibilidad-certeza) se establecerá el campo
de variación de las probabilidades. Lógicamente, una probabilidad muy próxima a cero
nos indicará un suceso de muy difícil presentación). Asimismo, una probabilidad
cercana a 1, indicará que es muy posible que el suceso ocurra.
Implica que los N casos que figuran en el denominador pueden ser contados,
a pesar de ser un número grande y clasificados conforme cumplan o no las
propiedades para constituirse en eventos favorables o no favorables. Es por
ello que la definición clásica excluye el cálculo de probabilidad para espacios
muestrales infinitos contables o directamente infinitos.
Equivale a decir que los casos posibles son los que constituyen el denominador
del cociente y no existe ninguna otra posibilidad más. Se excluye toda
posibilidad que no se encuentre dentro de los N casos posibles.
( A)
P ( A) =
N
29
Críticas a la definición clásica de probabilidad
Por cierto, que la definición dada resulta restrictiva para estudios más profundos, pero
como iniciación a un curso de probabilidades es una aproximación suficiente, pues tiene
la ventaja de ser fácilmente comprensible y de inmediata aplicación. Nos permite
resolver muchos problemas interesantes del cálculo de probabilidades, precisamente en
aquellos en los cuáles es posible determinar, por recuento o mediante la aplicación del
cálculo combinatorio, el número de casos posibles y favorables. No obstante, a pesar de
estas facilidades, las limitaciones que tiene esta concepción primitiva de la probabilidad
son importante y se pueden numerar:
Al decir que todos los casos deben ser igualmente posibles, es una forma
bastante rebuscada de eludir la afirmación de que todos los casos deben ser
“igualmente probables”, que todos los casos presentan, en definitiva, la misma
probabilidad de ocurrencia. Cuando decimos que el dado es homogéneo
estamos también señalando que todas las caras tienen la misma probabilidad
de presentarse. Resulta evidente entonces que en la definición se está
incluyendo la misma palabra que se intenta definir, dando lugar a una
referencia circular o tautología.
Aún con todas las limitaciones impuestas por sus supuestos y las críticas recibidas, la
definición clásica se sigue usando porque implícitamente tiene un costo de
implementación muy bajo. Esto es, ante un experimento aleatorio (como por ejemplo el
del dado) corresponde preguntarnos si este está bien fabricado y diagnosticar sobre su
calidad de fábrica o directamente usarlo, suponiendo que las cumple, para resolver los
casos que se nos proponen. A esta situación es a la que algunos autores como, por
ejemplo, T. YAMANE han definido como “principio de razón insuficiente”3, que consiste
en que cuando no hay fundamentos para preferir uno de los posibles resultados o
33
Taro Yamane. “Estadística”. Editorial Harla. Madrid, 1987
30
sucesos a cualquier otro, todos deben considerarse con la misma probabilidad de
ocurrencia.
( A)
P ( A) =
N
( A)
P( A) =
N
De esta manera, por ejemplo, la probabilidad de obtener figura al sacar una carta de un
mazo que sea figura (suceso A ), será 12/40, y de no sacar una figura en una extracción
(suceso contrario A ) será 28/40. De esta manera:
( A) ( A) N
( A) + ( A) = N , P( A) + P( A) = + = =1
N N N
P( A) + P( A) = p + q = 1
Si p + q = 1 → p = 1− q q = 1− p
Los autores que mayormente desarrollaron el enfoque fueron Von Mises, Kolmogorov y
Smirnov, bajo ciertos matices y diferencias, pero fundamentalmente orientados a realizar
ensayos o experimentos aleatorios como manera de obtener valores probabilísticos. Bajo
este enfoque, se realiza un experimento aleatorio “E” (como puede ser, por ejemplo, el
lanzamiento de una moneda) de manera reiterada y bajo condiciones uniformes.
Planteamos dos resultados mutuamente excluyentes (obtener “Cara”, por ejemplo, como
suceso favorable) y computamos la frecuencia relativa de la cantidad de sucesos
31
favorables (Cara, en nuestro ejemplo) sobre las “n” pruebas repetidas realizadas. Al
momento previo a un nuevo intento, vamos representando cómo se comporta dicha
frecuencia relativa. Gráficamente, veremos un comportamiento similar al siguiente
gráfico.
Del gráfico apreciamos que las fluctuaciones de las frecuencias relativas de obtener
caras, f r ( A) varía considerablemente cuando “n” es pequeño, pero cuando “n” es
grande, la amplitud de las frecuencias relativas o de las fluctuaciones disminuye. Este
fenómeno se expresa así: “La frecuencia relativa resulta estable o la frecuencia relativa
presenta regularidad estadística a medida que “n” crece”. Vemos en el gráfico, cómo la
amplitud de las fluctuaciones decrece gradualmente cuando “n” aumenta. A partir de
200 tiradas de moneda, vemos claramente que dicha frecuencia relativa (en azul) se
“pega” a una línea roja constante, sobre la cual muestra convergencia, dicho valor
representa la probabilidad P(A). Este valor es 0,50, curiosamente nuestro valor de
probabilidad para obtener Cara utilizando una moneda simétrica usando la definición
clásica de probabilidad. ¿Y si la moneda no hubiera resultado ser simétrica, por ejemplo,
por estar arqueada? La definición clásica o Laplaciana no nos podría suministrar un
valor de P(A), pero la definición frecuentista sí, toda vez que dicha línea roja se hubiera
posicionado en otro punto en la escala 0-1.
Lo más interesante del principio de estabilidad de las frecuencias relativas resulta en que
para cualquier tipo de experimento aleatorio realizado bajo idénticas condiciones, el
valor de estabilización de la frecuencia relativa siempre se podrá obtener a medida que
“n” crece indefinidamente y, ese resulta en el valor de la probabilidad P(A). La cuestión
es cuán grande deba ser “n”. Los autores más duros de esta escuela (en particular,
Kolmogorov) sugiere que esto se logra o alcanza recién en el infinito, y sólo en el infinito
de pruebas, se puede hablar de probabilidad. Por lo tanto:
P( A) = lim f r ( A)
n →
32
infinito. Esta diferencia no es menor, dado que en la primera versión podemos hablar de
P(A) para un suceso A, en tanto que, en la segunda versión, solo podemos hablar de P(A)
como el límite de un proceso.
Esta condición está postulada como condición para realizar las pruebas, pero
no está debidamente probada en la experimentación. Dicho de otra manera,
cómo verificar que la moneda sea lanzada correctamente y en las mismas
condiciones experimentales, por ejemplo.
33
dos individuos razonables con la misma prueba puedan tener grados diferentes de
confianza en la verdad de una preposición.
La crítica más importante que recibe esta escuela para concebir la probabilidad radica en
la falta de consistencia teórica y científica para definir y conceptualizar a la misma. La
crítica abarca tanto a los fundamentos para definir a la probabilidad, como en los
alcances que la misma tiene desde el punto de vista aplicado.
4
La teoría de la medida de la probabilidad resulta en el tratamiento más formal que se puede aplicar sobre la
probabilidad a los conjuntos. Su nacimiento es atribuido a Andreí Kolmogorov quien en 1933 en su obra “Los
34
fundamentos teóricos de dicha relación entre conjuntos y medidas sobre los conjuntos.
Parte de estas medidas son las conocidas como propiedades, axiomas o postulados de la
probabilidad que seguidamente veremos:
Demostración:
P( A B) = P( A) + P( B)
Denotando que B =
P ( A ) = P ( A) + P () (1)
Demostración:
Como: P(S ) = P( A A) = P( A) + P( A) = 1
fundamentos de la teoría de la probabilidad” estableció una correspondencia entre los conjuntos y una medida de
dichos conjuntos, el cuál en Estadística dicha medida responde al concepto de “Probabilidad”.
35
Entonces, resulta: P( A) = 1 − P( A)
Demostración:
Como: P( B) = P A ( B / A) = P( A) + P( B / A)
P ( B ) P ( A)
Demostración:
Se enuncia así: “La suma de las probabilidades de todos los sucesos posibles
mutuamente excluyentes que conforman el espacio muestral es 1”
Demostración:
36
Propiedad 6: Propiedad de la adición de dos sucesos no excluyentes
Se enuncia así: “Si los eventos A y B, pertenecientes al espacio muestral “S”, son dos
eventos no excluyentes entre sí, entonces P ( A B ) = P ( A) + P ( B ) − P ( A B ) ”
No hay acuerdo generalizado entre los autores por considerar a dicha propiedad como
estrictamente una propiedad de la probabilidad o uno de los teoremas de la
probabilidad. Como resulta de una cuestión de mucha importancia tener esta relación,
por sus consecuencias teóricas y prácticas, dejaremos la demostración para cuando la
misma sea estudiada como teorema propiamente dicho.
P ( A B ) = P ( A) + P( B) − P( A B)
DEMOSTRACIÓN.
37
Recordando la propiedad Nro.16 de la Teoría de Conjuntos (segundo uso del
complemento), vimos que:
A B = A ( A B) [1]
Esto es: “A” queda representado por los puntos muestrales contenidos en él (propios y
compartidos con B) y los puntos exclusivos de “B” no compartidos con A. El diagrama
siguiente muestra en colores, ambos conjuntos. Claramente, A y ( A B) son conjuntos
mutuamente excluyentes.
P( A B) = P( A) + P( A B) y, P( B) = P( A B) + P( A B)
(1) (2)
P( A B) = P( B) − P( A B)
38
Y reemplazando en la (1), se obtiene la fórmula buscada de la probabilidad total para
sucesos compatibles o no excluyentes
P( A B) = P( A) + P( A B) = P( A) + P( B) − P( A B)
Intuitivamente, diremos que al sumar los elementos contenidos en el conjunto A con los
del conjunto B, existen elementos muestrales contenidos en la intersección de ambos que
son contabilizados o sumados doblemente, lo cual se requiere deducirlos. Esta es la
razón por la que aparece la resta de la intersección de ambos conjuntos.
P( A B) = P( A) + P( B)
Ejemplo I
Solución:
39
Los registros en color anaranjado y la última columna en verde representan los casos
pertenecientes al conjunto (A). Se trata de 43 cuentas de Jubilados. Los registros en color
gris y también la última columna, representan casos de cuentas pertenecientes a Vecinos
en el radio descripto en el enunciado a la cooperativa (B). En caso se trata de 17 cuentas
asignadas. La última columna, representan cuentas de jubilados (por ser cuentas pares)
y de vecinos a la institución (por ser múltiplos de 5). Entonces existen 8 casos en esta
condición. Teniendo en cuenta esta asignación, la probabilidad hallada será:
43 17 8 52
P ( A B ) = P ( A) + P ( B ) − P ( A B ) = + − = = 0,5977
87 87 87 87
Ejemplo II
Solución:
P( A B) = 1 − P( A B) = 1 − 0,91 = 0,09
40
Ejemplo III
Por problemas de cuestión sanitaria, los bancos atenderán los días lunes a los jubilados
con terminación de documento 0 o 1. A continuación, se detalla la nómina de jubilados
clientes según terminación de documento:
De manera similar al caso de dos eventos, existirán dos situaciones bajo las cuales se
desarrolla el teorema:
P( A B C ) = P ( A) + P ( B ) + P (C ) − P ( A B ) − P ( A C ) − P ( B C ) + P ( A B C )
41
DEMOSTRACIÓN.
P( A B C ) = P A ( B C )
P ( A B C ) = P ( A D) = P( A) + P( D) − P( A D) Sabiendo que D = B C
P( A B C ) = P( A) + P( B C ) − P A ( B C )
P( A B C ) = P( A) + P( B) + P(C ) − P( B C ) − P A ( B C )
Y ahora trabajemos sobre la segunda probabilidad (teniendo muy en cuenta que está
precedida por un signo negativo)
P( A B C ) = P( A) + P( B) + P(C ) − P( B C ) − P ( A B) ( A C )
P( A B C ) = P( A) + P( B) + P(C ) − P( B C ) − P( A B) + P( A C ) − P ( A B) ( A C )
P ( A B) ( A C ) = P( A B C )
Sacando las llaves del último miembro y respetando el signo negativo que la precede a
cada uno de sus componentes, nos queda la versión definitiva del teorema de la
probabilidad total para sucesos compatibles de tres eventos.
P( A B C ) = P ( A) + P ( B ) + P (C ) − P ( A B ) − P ( A C ) − P ( B C ) + P ( A B C )
42
Utilizando los diagramas de Venn, la representación del cálculo de la probabilidad total
con tres eventos, viene dado del siguiente modo:
Observamos que la fórmula implica sumar de manera completa los tres conjuntos A,B y
C. Se deducen las zonas superpuestas de a dos entre los tres conjuntos, por estar
doblemente contabilizadas de los tres conjuntos, motivo por el cual se lo agrega una vez.
P( A B C ) = P ( A) + P ( B ) + P (C )
Ejemplo IV
43
a. ¿Cuál es la probabilidad que un alumno que se encuentre en el tercer año de la
carrera de Administración, curse alguna de estas materias?
b. ¿Cuál es la probabilidad que un alumno que se encuentre en tercer año de la
carrera de Administración curse las tres materias?
Solución:
a) Suponiendo que para cursar tercer año se requiera al menos cursar alguna de
estas tres materias, entonces:
P( A B C ) = 1
P( A B C ) = 1 − P ( A) − P ( B ) − P (C ) + P ( A B ) + P ( A C ) + P ( B C )
195 96 229 41 87 52 60
P( A B C ) = 1 − − − + + + = = 0,15
400 400 400 400 400 400 400
Ejemplo V
Un pelotero se encuentra conformado por 350 pelotas numeradas y 500 sin numeración.
Se sabe además que las pelotas numeradas son negras y las que no se encuentran
numeradas son de 4 colores distintos: verdes (100), rojas (160), azules (40) y el resto color
marrones. ¿Cuál es la probabilidad que al extraer 3 bolas con reposición se tenga una
pelota de distinto color, no numerada?
En el presente caso sólo nos interesará saber la probabilidad de combinar tres de cuatro
colores distintos sin interesar en el ordenamiento de los colores al momento de extraer
las tres pelotas.
44
Las combinaciones de pelotas de cuatro colores distintos serán: (V,R,A): (V,R,M);
(R,A,M) y (V,A,M). En cada una de estas combinaciones no interesará el orden en el cuál
lo colores van apareciendo. Tomemos, por ejemplo, el primer caso:
(V,R,A): Implica que nos será indistinto tener las pelotas ordenadas así: (VRA),(VAR);
(RVA), (RAV), (ARV) y (AVR). O sea, seis formas posibles para ordenar las extracciones
con esos colores. Por lo tanto:
0 1 1 1 0
3! 350 100 160 40 200
P(V R A) = . . . . . = 0, 0062
0!.1!.1!.1!.0! 850 850 850 850 850
Esto se lee: La probabilidad de que al extraer tres pelotas del pelotero con reposición se
obtenga una pelota verde, una roja y otra azul, sin interesar el orden que se produjo la
extracción es de 0,0062 (no llegamos siquiera a 1%).
El mismo ejercicio realizo combinando las otras posibilidades de colores con (V,R,M),
(R,A,M) y (V,A,M)
0 1 1 0 1
3! 350 100 160 40 200
P(V R M ) = . . . . . = 0, 0313
0!.1!.1!.0!.1! 850 850 850 850 850
0 0 1 1 1
3! 350 100 160 40 200
P( R A M ) = . . . . . = 0, 0125
0!.0!.1!.1!.1! 850 850 850 850 850
0 1 0 1 1
3! 350 100 160 40 200
P(V A M ) = . . . . . = 0, 0039
0!.0!.1!.1!.1! 850 850 850 850 850
La probabilidad de obtener que las tres bolas extraídas sean de diferentes colores y no
numeradas, tendrá como probabilidad:
45
aparición de suceso A1 o del suceso A2 o del suceso A3, … o del suceso Ak, o de
cualesquiera de ellos al mismo tiempo”.
Se sustituye la notación A, B, C,… por A1, A2, A3,… por razones de comodidad en la
notación. Sin entrar en detalles formales ni demostración, diremos que el caso general
(para los K sucesos) compatibles o no excluyentes, vendrá dado por la siguiente fórmula:
k k k
P( A1 A2 ... Ak ) = P( Ai ) − P( Ai ).P( Aj ) + P( A ).P( A ).P( A ) + ... + (−1)
h i j
( k −1)
P( A1 ).P( A j )..P( Ak )
i =1 i j h i j
P( A1 A2 ... Ak ) = P( A1 ) + P( A2 ) + ... + P( Ak )
46
por ejemplo, que no promocione la materia y necesite rendirla en la modalidad examen
final.
P( A B)
P( A / B) = siempre que P( B) 0
P( B)
DEMOSTRACIÓN.
Sabiendo que B ha ocurrido, se restringe el espacio muestral “S”, sólo a los casos
contenidos en B, el cuál funcionaría ahora como espacio muestral de A (se lo denomina
“conjunto fundamental B”). Es decir:
P( A)
P( A / B) =
P( B)
En esta segunda versión, donde “A” no necesariamente está incluido en “B”, debemos
considerar en el numerador sólo la parte de “A común a B”, es decir, su intersección
A B , por lo tanto:
47
P( A B)
P( A / B) =
P( B)
Ejemplo 1.
Una urna contiene 10 bolillas numeradas del uno al diez. Las primeras (1 a 3) son Rojas
y las restantes Verdes. Si se efectúa como experimento la extracción de una bolilla al azar.
Solución:
5
Taro Yamane. “Estadística”. Editorial Harla. Madrid (1987)
48
ellas es 0,1. La probabilidad de extraer una bollila roja (Suceso R), aplicando la
definición de probabilidad será:
( R) 3
P( R) = = = 0,3
N 10
b. Si al extraer una bolilla esta es roja. Con este cambio en las condiciones
experimentales, ¿cuál es la probabilidad que la bolilla en cuestión se trate de la
numerada con el 1?. La población es la totalidad de los puntos muestrales
elementales, es decir, las 10 bolillas. Al añadir información y cambiar las
condiciones iniciales, hemos limitado la población a una subpoblación de bolillas
rojas. La pregunta ahora es: ¿Qué probabilidad deberíamos asignarle a cada una
de las bolillas rojas en la subpoblación? Como sabemos, la probabilidad total de
obtener bolillas numeradas del 1 al 3, sabiendo que la obtenida es roja, es la
unidad. También se conocía inicialmente que la probabilidad de cualquier bolilla
era 0,1. Las nuevas probabilidades que se calculen para estas tres bolillas han de
ser tales que la proporción entre las probabilidades no cambien y sumen 1.
Entonces, primero hallo la probabilidad total de la subpoblación y luego, divido
cada probabilidad de los sucesos dentro de la subpoblación por ese total. Así:
P( B1 ) 0,1
P( B1 / R) = = = 0,33...
P( R) 0,3
P( B2 ) 0,1
P( B2 / R) = = = 0,33...
P( R) 0,3
P( B3 ) 0,1
P( B3 / R ) = = = 0,33...
P( R) 0,3
49
Ejemplo 2.
Solución:
P( A B) 1.265 12.850
P( B / A) = = = 0, 4774
P( A) 2.650 12.850
b. En este caso, el hecho conocido es que se sabe estamos trabajando con facturas
de cuenta corriente (Suceso B´). Se nos pide, calcular la probabilidad que las
mismas no se encuentren vencidas (Suceso A´). Por lo tanto:
P( A B) 2.350 12.850
P( A / B) = = = 0,6292
P( B) 3.735 /12.850
c. Sobre las facturas vencidas puede no interese el hecho que sean de contado o
cuenta corriente. En este caso, son facturas incondicionalmente vencidas, no
interviene el tipo. Por lo tanto, sabiendo que:
A = ( A B ) ( A B)
50
4.9.- TEOREMA DE LA PROBABILIDAD COMPUESTA O REGLA DEL
PRODUCTO DE LAS PROBABILIDADES
Previamente a mostrar las fórmulas correspondientes a este teorema, desarrollaremos el
concepto de “Independencia estadística de sucesos aleatorios”. En principio, si la
probabilidad que un evento A ocurra no se ve afectada por la presencia o ausencia del
evento B, diremos que ambos eventos (A y B) son independientes. El ejemplo más
sencillo (y de mayor uso también) para entender lo que implica sucesos estadísticamente
independientes consiste en realizar extracciones sucesivas de bolillas de una urna
cuando las bolillas, una vez observadas, son repuestas. Si extraemos dos bolillas con
reposición de una urna que contiene cierta cantidad de bolillas blancas y negras y
exigimos, por ejemplo, obtener dos extracciones con bolillas blancas, una vez extraída y
calculada la probabilidad de obtener bolilla blanca en la primera extracción, ese mismo
cálculo nos serviría para el segundo ensayo, dado que el resultado de lo que ocurrió en
la primera prueba no incide en la segunda. Además, hay situaciones en las cuáles la
definición misma de las variables o eventos son, por naturaleza independientes. Por
ejemplo: Peso y coeficiente intelectual de las personas. No tenemos argumentos para
pensar que el peso incida en el coeficiente intelectual de la gente y, al revés.
Se dice que dos eventos aleatorios A y B son independientes, si se cumple con cualquiera
de los siguientes casos:
1. P( A / B) = P( A)
2. P( B / A) = P( B)
3. P( A B) = P( A).P( B)
Así, por ejemplo, los eventos “A” fumar y “B” contraer epoc, son dependientes porque
la probabilidad condicional de contraer epoc siendo fumador, es mayor que la
probabilidad incondicional de padecer de la enfermedad. Situación parecida ocurre con
la altura y el peso de las personas. En tanto, el evento “llover hoy” y “llover dentro de
un mes” parecen ser independientes.
Ejemplo 1.
1 1 1
P ( A) = P( B) = P (C ) =
2 2 3
51
a. Sabiendo las probabilidades anteriores, tratamos de determinar alguna de las
probabilidades condicionales:
P( A B)
P( A / B) = pero; A B = entonces: P ( A / B ) = 0
P( B)
Entonces:
P( A C ) 1/ 6
P( A / C ) = = = 1/ 2
P(C ) 2/6
Como: P( A / C ) = P( A) = 1/ 2
1 1 1
P ( A C ) = P ( A).P (C ) = . =
2 3 6
(Sabiendo que sólo el 1 cumple con esa doble propiedad de pertenecer a ambos
conjuntos, su probabilidad resulta en un sexto también)
Ejemplo 2.
A : La marca X es preferible a la Y
B : La marca X es la mejor
C : La marca X es la segunda mejor
D : La marca X es la peor
Solución:
Pasemos a repasar cuántos y cuáles son los puntos muestrales de nuestro experimento
aleatorio.
52
E1 : X , Y , Z E3 : Y , X , Z E5 : Z , X , Y
E2 : X , Z , Y E4 : Y , Z , X E6 : Z , Y , X
Cada uno de estos ordenamientos, son igualmente probables (dado que el sommelier no
tiene intenciones o preferencias a priori por beneficiar o perjudicar a ninguna marca en
particular)
P ( A) = 1/ 2 P( B) = 1 / 3 P (C ) = 1/ 3 P ( D ) = 1/ 3
Buscamos comprobar:
P( A B) 2 / 6
P( A / B) = = =1 P ( A) → Sucesos dependientes
P( B) 1/ 3
P( A C ) 1/ 6
P( A / C ) = = = 1/ 2 = P ( A) → Sucesos independientes
P(C ) 1/ 3
P( A D) 0 / 6
P( A / D) = = =0 P ( A) → Sucesos dependientes
P( D) 1/ 3
Teniendo en cuenta lo que vimos anteriormente, cuando los sucesos son dependientes
es habitual que acontezca que P ( B / A) P( B)
El caso particular de este teorema radica cuando las probabilidades de los sucesos A y B
se muestran de manera independiente. En este caso, no tiene sentido ya condicionar la
probabilidad de B, a la situación que haya ocurrido o no el evento A, ya que ambos
sucesos no dependen el uno del otro.
53
P( A B) = P( A).P( B) Para sucesos independientes
Situación que se deriva del hecho que, cuando los sucesos son independientes, la
P( B / A) = P( B)
DEMOSTRACIÓN.
( A B)
P( A B) =
N
Si multiplicamos y dividimos el segundo término de la igualdad por un mismo número,
en este caso por la cantidad de casos que contiene el evento A, en el espacio muestral S.
( A) ( A B)
P( A B) = .
N ( A)
P ( A B ) = P ( A).P ( B / A)
P( A B) = P( A).P( B)
El teorema puede ser generalizado para cualquier número de eventos aleatorios. Para el
caso general, de sucesos dependientes, la fórmula será:
54
Ejemplo 1
Solución:
Atendiendo el caso que una misma moto no pueda ser utilizada para realizar más de
una entrega, estamos en presencia de eventos que son dependientes. Si los tres pedidos
deben ser entregados en motos, entonces definimos a los eventos:
Para cumplir con el requisito que las tres entregas sean realizadas por motos, deberemos
calcular P ( A B C )
16 15 14 3.360
P ( A B C ) = P ( A).P ( B / A).P (C / AB ) = . . = = 0, 421
21 20 19 7.980
Ejemplo 2
Solución:
P( A B ) = P ( A).P ( B ) = 0,1.0, 2 = 0, 02
55
dicho evento. Un segundo mecanismo, era determinar los eventos favorables
identificando conjuntos dentro del espacio muestral y, aplicando algunas de las
propiedades de los conjuntos, obtener la probabilidad deseada. Cualquiera de los dos
casos descriptos, permiten calcular la probabilidad con la representación del espacio
muestral. Dichos métodos se denominan “cálculo de la probabilidad mediante el método del
punto muestral”.
El estudio de las leyes y axiomas de probabilidad, junto con los teoremas nos permiten
abordar un segundo método de cálculo de probabilidades denominado “cálculo de la
probabilidad mediante el método de la composición de eventos”. Fundamentalmente, el método
consiste en plantear la probabilidad de ciertos eventos compuestos utilizando las
relaciones de los conjuntos y combinando algunos de los teoremas y propiedades ya
desarrolladas.
Ejemplo 1
Un país cuenta con cuatro partidos políticos mayoritarios y una quinta minoría entre
indecisos y otras fuerzas políticas menores. El gobierno de turno decide llevar adelante
un plebiscito sobre un tema de interés nacional, por ejemplo, de una reforma impositiva
profunda. A continuación, se detalla la composición de votantes sobre los resultados de
56
las últimas elecciones y el porcentaje a favor de la reforma que se tienen dentro de cada
uno de los partidos.
Solución:
Podemos ver que el espacio muestral está conformado como una partición de eventos
mutuamente excluyentes respecto al partido que se ha votado (nadie pudo haber
participado votando dos o más partidos al momento de las elecciones), y un evento R
que muestra la probabilidad a favor de la Reforma en cada uno de los partidos
involucrados, el cual se encuentra condicionado conforme cada uno de los partidos que
se tome en consideración.
El ejemplo nos pide calcular la probabilidad de (R). Así, por ejemplo, si deseamos saber
cuál es la probabilidad que una persona haya votado a (A) y, además, esté a favor de la
Reforma (R), tendríamos que aplicar el teorema de la probabilidad compuesta con
sucesos dependientes. Por lo tanto:
57
Así, podríamos calcular la probabilidad compuesta para cada uno de los partidos
involucrados:
Ejemplo 2
Una variedad híbrida de cebada tiene una probabilidad de germinar en suelos arenosos
del orden del 80%. Se hace una prueba de laboratorio con tres semillas, las cuáles son
depositadas en distintos germinadores con arena.
Solución:
58
semilla es independiente de lo que pasa con las restantes, al estar el experimento
diseñado en germinadores distintos).
De esta manera, estamos casi seguros en que alguna de las tres semillas germinará en las
condiciones en que se realizó el experimento.
P( A) = (1 − p 3 ) 0, 70
De esta forma, la probabilidad de que al menos una semilla de las tres germine (A), será:
P( A1 A2 A3 ) = P( A1 ) + P( A2 ) + P( A3 ) − P( A1 A2 ) − P( A1 A3 ) − P( A2 A3 ) +
+ P( A1 A2 A3 )
Dado que cada uno de los eventos compuestos son independientes, entonces:
Ejemplo 3
59
el “r” ésimo individuo en la fila resulte ser un portador asintomático del virus y un
peligro potencial de contagio?
Entonces, el individuo “r” podría estar ubicado en la escala desde el primero al “n”,
donde podríamos decir que “n” no necesariamente debe estar definido, es decir, podrían
presentarse muchísimos individuos a realizar la compra u operación ese día.
De: Ei : El número que guarda cada individuo en la fila, donde i = 1, 2,..., n , nos
interesa el individuo “r” (primer caso portador del virus)
Er = A1 A2 A3 ... Ar −1 Ar
r = 1, 2,3,..., n
60
P( E100 ) = (1 − 0,005)100 = 0,6060
¿Cuál es la probabilidad que exactamente el voluntario 10, sea el primer caso detectado?
Cómo quedaría definido el espacio muestral (S) de este evento. Si recordamos que E1,
primer caso portador sea el individuo 1, E2, primer caso portador sea el individuo 2, etc.
P( S ) = P( E1 ) + P( E2 ) + P( E3 ) + ... + P( Ei ) + ...
P( S ) = (0, 005) + (0,995).(0, 005) + (0,995) 2 .(0, 005) + ... + (0,995)i −1.(0, 005) + ...
1
= (0,005). (0,995)i = (0,005). =1
i =0 1 − (0,995)
Dada que la fracción implicada en la sumatoria, involucra una serie geométrica cuyo
factor “r” es menor que uno, es decir:
1
r 1 → ri = la misma es una serie convergente
i =0 1− r
Conclusión: Aún con tasas de presencia de portadores muy bajas, la probabilidad de
tropezarnos con un caso positivo, no resulta ser tan baja y dicha probabilidad aumenta
notablemente con la circulación de gente. Por otra parte, dado que un portador puede
no tomar medidas de higiene apropiadas, la ubicación en la fila es sumamente
importante. ¿Conviene hacer las compras temprano?
Ejemplo 4 (Video)
61
4.11.- PROBABILIDAD DE LAS CAUSAS O REGLA DE BAYES
La regla de Bayes fue publicada en 1763 por el matemático inglés Thomas Bayes6. Desde
su aparición dentro del cálculo de probabilidades el tipo de probabilidades que utiliza o
emplea resulta controvertido, por cuanto combina elementos del cálculo probabilístico
tradicional y algunos aspectos de la teoría subjetiva de la probabilidad. Su importancia
es fundamental en la Estadística Moderna a tal punto, que hay toda una rama de la
Estadística llamada “Estadística Bayesiana”. La misma permite revisar una probabilidad
subjetiva cuando un experimento aleatorio aporta información adicional. La estadística
bayesiana muestra utilidad en estimaciones basadas en el conocimiento subjetivo a priori
y el hecho de permitir revisar esas estimaciones en función de la evidencia empírica.
También hay discusión metodológica respecto a si se trata de una regla o de un teorema:
Por un lado, su traducción del inglés hace referencia originariamente a la “Bayes´ Rule”,
y por el otro, aquellos autores de naturaleza más matemática se niegan a elevar al rango
de “teorema” un planteo formal que en esencia no es más que una aplicación de los
teoremas de probabilidad que ya discutimos previamente. No se trata de una discusión
tan relevante, pero su nivel de aplicabilidad en el campo de la Estadística y las
Probabilidades, es innegable.
ENUNCIADO.
P( Bi ).P( A / Bi )
P( Bi / A) =
P( B1 ).P( A / B1 ) + ... + P( Bi ).P( A / Bi ) + ... + P( Bn ).P( A / Bn )
DEMOSTRACIÓN.
6
Thomas Bayes, “An Essay Towards Solving a Problem in the Doctrine of the Chances”, (1763)
62
Del estudio del diagrama podemos apreciar que el espacio muestral queda
completamente definido por una partición de B, de forma tal que la suma de los
subconjuntos “Bn” dan por resultado (S). Por otra parte, por tratarse de una partición no
presentan solapamiento o zonas de intersección entre ellos. Si, el evento “A” es
representado sobre el mismo espacio muestral, el mismo queda completamente definido
mediante zonas de intersección con algunas de las modalidades de B (aunque no
necesariamente con todas).
“Si los eventos B1 , B2 ,..., Bn son particiones del espacio muestral (S) y, por tanto,
mutuamente excluyentes, tal que P ( Bi ) 0 , para i = 1, 2,..., n , entonces para
n n
cualquier evento A, definido en S: P( A) = P( A Bi ) = P(Bi ).P( A / Bi ) ”
i =1 i =1
Como podemos apreciar, las probabilidades de la intersección entre A con las diferentes
modalidades de B, representa una probabilidad compuesta con sucesos dependientes,
por lo tanto:
n n
P( A) = P( A Bi ) = P( Bi ).P( A / Bi )
i =1 i =1
A = ( A B1 ) ( A B2 ) ... ( A Bn )
P( A) = P( A B1 ) + P( A B2 ) + ... + P( A Bn )
63
Cada uno de los componentes sumandos del segundo término, es resuelto mediante el
teorema de la probabilidad compuesta con sucesos dependientes, por lo tanto:
n
P( A) = P( B1 ).P( A / B1 ) + P( B2 ).P( A / B2 ) + ... + P( Bn ).P( A / Bn ) = P( Bi ).P( A / Bi )
i =1
P( A Bi )
P( Bi / A) =
P ( A)
P( Bi ).P( A / Bi )
P( Bi / A) =
P( B1 ).P( A / B1 ) + ... + P( Bi ).P( A / Bi ) + ... + P( Bn ).P( A / Bn )
Ejemplo 1
Imaginemos tres estaciones de peajes, en donde además se realizan controles
vehiculares. La estación AU.1, recibe diariamente el 45% del tránsito de acceso a la
ciudad, la AU.2, el 35% y la AU.3, el 20% restante. Se sabe que la probabilidad de que se
realicen multas para los vehículos que circulan por la vía AU.1 es del orden del 6%, de
la vía AU.2, 3% y los que recorren la vía AU.3, un 18%. Responderemos tres preguntas:
64
2. Sabiendo que el conductor seleccionado ha sido multado, ¿cuál es la
probabilidad que haya circulado por la vía AU.3?
3. Sabiendo que el conductor no ha sido multado, ¿cuál es la probabilidad que
haya circulado por la Vía AU.1 o por la Vía AU.2?
Solución.
Antes de resolver el caso, definimos los eventos:
El segundo inciso, nos muestra que el conductor resultó multado y deseamos averiguar
la probabilidad que haya sido por haber tomado el camino AU.3. Por lo tanto, aplicamos
la fórmula de Bayes:
65
(0, 20).(0,18) 0, 036
P( B3 / A) = = = 0, 4898
(0, 45).(0, 06) + (0,35).(0, 03) + (0, 20).(0,18) 0, 0735
El tercer inciso, nos indica que el conductor no resultó multado y deseamos saber que
haya circulado por la AU.1 o por la AU.2. Entonces, diremos que:
P( B1 / A) P( B2 / A)
P ( B1 B2 ) / A = +
P( B1 / A) + P( B2 / A) + P ( B2 / A) P ( B1 / A) + P ( B2 / A) + P ( B2 / A)
P( B3 / A) = 1 − P( B3 / A) = 1 − 0,1788 = 0,8212
66
En términos del diagrama de árbol, el producto de las probabilidades posicionadas en
las ramas sombreadas, representan nuestro numerador, y el producto de las
probabilidades subrayadas, el denominador.
Ejemplo 2
Una empresa pesquera cuenta en el muelle de amarre con tres embarques de frutos de
mar destinados a la exportación, a los que llamaremos Embarque 1, 2 y 3,
respectivamente, con el siguiente contenido (en miles de cajas estándar):
En aduana, se elige uno de los embarques al azar para estudiar la calidad y contenido de
una de las cajas. La seleccionada resulta ser una caja de pescados. ¿Cuál es la
probabilidad que el embarque elegido haya sido el 2, sabiendo que el mismo corre
mayores riesgos de rechazo de producto por los días de estacionamiento en muelle?
Solución.
Antes de entrar en los detalles de resolución del caso analicemos dos conceptos muy
asociados (y que se usan con frecuencia) en el caso de la regla de Bayes: El de las
“probabilidades a priori” y el de las “probabilidades a posteriori”. La probabilidad
inicial (a priori) de elegir el embarque 2 (el embarque problemático) resultaría de un
33,33%, pero el hecho conocido que ya se tenga en inspección una caja de pescados,
debería preocupar enormemente a los directivos de la empresa. Si uno observa, la
cantidad de cajones de pescado que cuenta dicho embarque son muy altas comparadas
67
con los otros dos. Por lo tanto, el hecho de encontrarnos con un suceso ya consumado,
cambia las condiciones de cálculo de la probabilidad buscada:
B1 : Embarque Nro.1
B2 : Embarque Nro.2
B3 : Embarque Nro.3
Por lo tanto,
P( B2 ).P( A / B2 )
P( B2 / A) = =
P( B1 ).P( A / B1 ) + P( B2 ).P( A / B2 ) + P( B3 ).P( A / B3 )
Ejemplo 3
Una persona, al perderse en una excursión de campo, sale a un claro desde donde surgen
cinco caminos. Se sabe que la probabilidad de encontrar la salida al término de una hora,
tomando cada uno de los caminos alternativos es respectivamente: 0,6; 0,3; 0,2; 0,1 y 0,1.
¿Cuál es la probabilidad que esta persona que se ha perdido regrese por el primer
camino, saliendo que retornó a su grupo al cabo de una hora?
Solución.
Denominando los eventos:
68
REFERENCIAS BIBLIOGRÁFICAS
69