Capítulo 2
Capítulo 2
Tamaño de muestra
Confianza
Probabilidad de que la estimación por intervalos del parámetro (valor poblacional) no falle.
Se denota por 1−𝛼.
Ejemplo
Confianza d=96,6%
Comp=3,4%
Mitad=1,7
Suma =96,6+1.7=98,3%=0,930
Z=0,9830=2,12
Ejemplo 2
Confianza=81%
Comp=19%
Mitad=9,5%
Suma 81%+9,5%=90,5% =0,9050
Z=0,9050=1,315
Error de estimación para el promedio
Diferencia, en valor absoluto, entre el valor de la media muestral y la media poblacional.
𝐸=|¯𝑥−𝜇|
Tamaño de muestra
Generalmente es afectado por factores como:
Variabilidad de la población.
Precisión deseada o el máximo error permitido.
Nivel de confianza.
Costo, tiempo, recursos y las no respuestas (No cuantificables).
Tamaño de muestra para promedios
Población infinita: 𝑛_0=((𝜎∙𝑧)/𝐸)^2donde 𝑧 es el valor de la distribución
normal estándar y 𝐸 es el error máximo permitido.
Población finita: 𝑛=𝑛_0/(1+𝑛0/𝑁) donde 𝑛_0 se calcula con la fórmula
para población infinita y 𝑁 es el tamaño de la población.
Una empresa posee un total de 800 camiones que se emplean para repartir sus productos a nivel
nacional. Se desea estimar, mediante una muestra aleatoria de los camiones, la cantidad de
kilómetros recorridos mensualmente. Por un estudio realizado con anterioridad, se conoce que
esta variable tiene una desviación estándar de 380 kilómetros. La estimación debe tener un error
máximo de 30 kilómetros y una confianza del 98%. ¿Qué tamaño de muestra se necesita?
DATOS
Población=N=800 camiones
σ=Desviación estándar=380km
Error máximo permitido=E=30km
1-x=confianza=98% Z=0,9898 Z=tabla 2,32,5
𝜎⋅𝑧 380.2,325 2
𝑛= ( 𝐸 ) 𝑛= ( 30
) =867,3025= 868
NOTA
Nunca se puede dar el tamaño de muestra en decimales.
⋂0
𝑛𝑜 868
𝑛𝑜= 𝑁
= 868 =416,3069= 417
800
Una confianza del 98% y un error máximo permito de 30 kilometro, el tamaño mínimo de muestra
para determinar la cantidad promedio de kilómetros recorridos mensualmente por los camiones de la
empresa es de 417 camiones.
NOTA
Si aparece desviación estándar es de promedio
=368,7936=369
Con una confianza del 95% y un error maximo permitido de 5% el
tamaño mínimo de muestra para determinar la proporción de sus
empleados que aceptarían un nuevo programa de pensiones es de 369
empleados
Se realiza una investigación sobre la prevalencia de diabetes en adultos
mayores de 30 años en una población de 2000 personas. Se desea un
nivel de confianza del 99% y un error máximo de 3,5% en su estimación.
¿De qué tamaño debe ser la muestra?
Datos
E=3,5%
N=2000
P=50%
1-x=99% Z=0,9950 =2,575
𝑧 2,575 2
⋂0=ℙ(1−𝑃) (𝐸 ) =50%⋅ (1−50%) ( 3,5
) =1353,1887=1354)
0= ⋂
0 1356
⋂ ⋂0 = 1356 = 807,3941=808
1+ 𝑁 1+2000
Con una confianza de 99% y un error máximo permitido de 3,5% el
tamaño mínimo de muestra para determinar la prevalencia de
diabéticos en adultos mayores de 30 años es de 808 personas
Practica
Una fábrica distribuye a 1200 farmacias en cierto país sus productos y desean
realizar un estudio acerca de la cantidad de ingresos que perciben en promedio
de dichos lugares. Un estudio similar realizado en una compañía de un país
vecino reveló que se poseía una desviación estándar de 800 dólares. La
estimación debe tener un error máximo de 100 dólares y una confianza del
95%. ¿Cuál es el tamaño de muestra mínimo requerido?
Desviación estándar=800 dolares
E=100
1-x=95% =comp=5% =mitad=2,5% suma=95%+2,5%=97,5%
Z=0,975 =1,96
N=1200
800⋅1,96 2
⋂0= ( ) =245,86=247
100
247
⋂ 247 =204.8375=205
= 1+
1200
Interpretación
Con una confianza de 95% u un error mínimo permitido 100 dolares el
tamaño mínimo de muestra para determinar la cantidad de ingresos que
perciben en promedio es de dichos lugaresz es 205 ingresos
2. Por la venta de sus productos una empresa nacional desea conocer la
cantidad promedio de colones que gastan sus clientes. Por medio de una
muestra piloto, se determinó que había una desviación estándar de 4000
colones. El gerente de la tienda solicita una confianza del 90% y un error no
mayor a 500 colones, ¿cuál sería el tamaño de muestra mínimo requerido para
cumplir con su solicitud? R/ 𝑛 = 174
Datos
Desv estand=4000
Confianza=90% comp=10% mitad=5% suma=90+5=95%
Z=0,95 =1,645
E=500 colones
𝟒𝟎𝟎.𝟏,𝟔𝟒𝟓 𝟐
⋂𝟎= ( ) =𝟏𝟕𝟑.𝟏𝟖𝟓𝟔=𝟏𝟕𝟒
𝟓𝟎𝟎
𝑧 2 𝑛0
𝑛0 = 𝑝(1 − 𝑝) ( ) 𝑛= 𝑛 𝑝 = 0,5 si se
𝐸 1+ 0
𝑁
desconoce
3. Se desea conocer el porcentaje de estudiantes que aprueban un curso universitario de una nueva
malla curricular para ello se consultan datos de cursos similares en dicha universidad y se encuentra
que el porcentaje de aprobación es del 35%. Si se permite un error máximo del 2% y se necesita una
confianza del 90%, ¿cuál sería el tamaño mínimo de muestra necesario para el estudio? R/ 𝒏 = 𝟏𝟓𝟒𝟎
4. En un estudio médico realizado a ratones de laboratorio se desea conocer la proporción de sujetos
de prueba que tienen una reacción alérgica a ese medicamento. Si se necesita un 99% de confianza
para realizar pruebas en primates y un error máximo del 1%, ¿cuál sería el tamaño de muestra
necesario para realizar el estudio? R/ 𝒏 = 𝟏𝟔𝟓𝟕𝟕
PROBABLIDAD
Probabilidad: Una probabilidad es un valor numérico de la incertidumbre de
que un suceso específico pueda ocurrir.
Evento: Es un posible resultado de un experimento aleatorio.
Espacio muestral: Es el conjunto de todos los eventos simples posibles de
un experimento aleatorio.
Teoría clásica. Frecuencia relativa. Concepto subjetivo.
Cuando un experimento aleatorio tiene 𝑁 resultados igualmente posibles y
mutuamente excluyentes entonces la probabilidad de un evento 𝐴,
denotada por 𝑃(𝐴), es:
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑎𝑙 𝑒𝑣𝑒𝑛𝑡𝑜
𝑃(𝐴) =
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠
En una bolsa hay 7 pelotas azules, 6 pelotas verdes y 12 pelotas rojas que solo se diferencian por su
color. Determine la probabilidad de que al seleccionar una pelota al azar esta:
A) Sea verde. B) Sea azul. C) Sea amarilla. D) No sea azul
A) Sea verde v=seleccionar al azar una pelota verde
P(A)=6/25=0,24
La probabilidad de seleccionar al azar una pelota verde es 24%
Unidades
A B C
defectuosas
Lunes 13 33 25
Martes 18 28 23
Miércoles 21 30 19
La probabilidad de seleccionar una bola roja y luego seleccionar una bola azul es 15%
La probabilidad de seleccionar una bola blanca y luego seleccionar una bola sin remplazar
es de 3,15%
Distribución de probabilidades
Distribución de probabilidades para variables discretas.
Distribución Binomial. Los experimentos de tipo binomial establecen 4 supuestos:
1. Existen dos resultados posibles, éxito o fracaso.
2. Existe un número 𝑛 fijo de ensayos o intentos.
3. La probabilidad de éxito 𝑝 permanece constante en todos los intentos.
4. Todos los intentos son independientes entre sí.
Formula=distr.binom.n(x;n;p;0)
X=cantidad de éxitos
N=cantidad de intentos o ensayos
P=probabilidad de éxitos
O=verdadero o falso (i=si valor acumulado o=no valore exacto )
Una aerolínea tiene cinco vuelos diarios de Boston al aeropuerto de Pennsylvania.
Suponga que la probabilidad de que cualquier vuelo llegue tarde sea de 0,20.
A) ¿Cuál es la probabilidad de que ninguno de los vuelos llegue tarde hoy?
B) ¿Cuál es la probabilidad de que exactamente uno de los vuelos llegue tarde hoy?
Un vendedor de un producto sabe, por su experiencia, que logra la venta en el 30% de los
clientes que visita, porcentaje que ha permanecido constante a lo largo del tiempo. Cada
cliente no tiene contacto con los demás. El vendedor desea saber la probabilidad de que si
visita 8 clientes:
A) Logre vender exactamente 2 casos.
B) Logre vender en por lo menos cuatro casos
Se sabe que la probabilidad de que un cierto tipo de calentador falle ante un
sobrecalentamiento es de 15%, calcule la probabilidad de que entre 6 de tales
calentadores:
A) Fallen entre 2 y 4 calentadores.
B) No fallen 5 calentadores
Distribución de Poisson. Es una distribución de probabilidad de variable aleatoria discreta
que permite determinar la probabilidad del número de eventos que ocurren en un
intervalo de tiempo dado o en un área o volumen específico.
Si se desea saber una cantidad 𝑥 de éxitos con 𝜆 de media la probabilidad está dada por:
=𝑃𝑂𝐼𝑆𝑆𝑂𝑁.𝐷𝐼𝑆𝑇(𝑥;𝜆;0) x= cantidad de exitos
=𝑃𝑂𝐼𝑆𝑆𝑂𝑁.𝐷𝐼𝑆𝑇(𝑥;𝜆;1) λ=promedio en el intervalo observado
NOTA: La primera se utiliza para un valor específico, la segunda para valores menores o
iguales al valor específico
Una compañía asegura propiedades frente a la playa; durante cualquier año, la
probabilidad de que un huracán de categoría III o más intenso azote la costa es de
0,05. Si un dueño de casa obtiene una hipoteca de 30 años por una propiedad recién
comprada:
A) ¿Cuáles son las posibilidades de que experimente exactamente un huracán de
categoría III o superior durante el periodo del crédito?
C) ¿Cuáles son las posibilidades de que experimente al menos dos huracanes de categoría
III o superior durante el periodo del crédito
A una oficina de banco llegan, en promedio, 3 clientes por hora a solicitar un crédito.
Calcule la probabilidad de que:
A) en una hora aleatoriamente seleccionada lleguen exactamente 4 clientes.
B) en una hora aleatoriamente seleccionada lleguen 7 o más clientes.
C) en 5 horas de comportamiento similar lleguen entre 14 y 17 clientes.
Distribución geométrica
Solo 2 resultados
Eventos indeoendientes
Probabilidad de éxitos constante
Se detiene hasta que se de el éxito por primera vez
X= cantidad de veces que se repite hasta que se de el éxito( cunado se da el éxito no se
cuenta no se usa excell p(x=k)(i-P)´´kp P=probabilidad de éxitos K=intentos fallidos
Los experimentos de tipo geométrico establecen dos supuestos:
1. La probabilidad de éxito 𝑝 permanece constante en todos los intentos.
2. Todos los intentos son independientes entre sí.
Además, cabe resaltar que se define como “todos los intentos hasta que se produzca el
éxito” por lo que puede tomar el valor de cero.
Valor fijo
Si se desea conocer la probabilidad de que se dé el primer éxito en 𝑘+1 intentos bajo una
valor de probabilidad 𝑝 la fórmula está dada por:
𝑃(𝑋 = 𝑘)=(1 − 𝑝)𝑘 𝑝 para 𝑘 = 0, 1, 2,
…Definamos una experiencia aleatoria cuyo resultado sólo puede ser el suceso 𝐴 o su
complemento 𝐴𝑐, y que se repite secuencialmente hasta que aparece el suceso 𝐴 por
primera vez.
Definamos la variable aleatoria 𝑋 como el número de veces que repetimos la experiencia
en condiciones independientes hasta que se dé 𝐴 por primera vez. Bajo estas condiciones,
decimos que la variable 𝑋 sigue una distribución geométrica o de Pascal de parámetro 𝑝 =
𝑃(𝐴).
Un joven desea hacer un juego lanzando una moneda común al aire presumiendo que
puede evitar que en la cara superior de dicha moneda salga el escudo:
A) ¿Cuál es la probabilidad de que salga escudo al primer lanzamiento?
B) ¿Cuál es la probabilidad de que salga el primer escudo al quinto lanzamiento?
En juego de un casino se gana al obtener un 6 luego de lanzar un dado regular. Si un joven
decide jugar:
A) ¿Cuál es la probabilidad de que gane en el segundo lanzamiento?
B) ¿Cuál es la probabilidad de que gane después de perder 3 veces?
Valor de z: Distancia entre un valor seleccionado (x) y la media (µ) medida en unidades de
desviación estándar (σ)
Comando
Para calcular utilizando Excel debemos utilizar:
=DISTR.NORM.N(x ; media ; desviación estándar ; 1)
Al realizar dicho comando se obtiene la probabilidad para los valores menores o iguales, o
simplemente menores que el valor de x utilizado.
El peso de un zapato deportivo tiene una distribución normal con media 12 onzas y
desviación estándar de 0,5 onzas
a. ¿Cuál es la probabilidad de que el zapato pese menos de 11 onzas?
¿Cuál es la probabilidad de que el zapato pese más de 12,5 onzas
En una ciudad se estima que la temperatura máxima en el mes de junio sigue una
distribución normal, con media 23° y desviación típica 5°. Calcular el número de días del
mes en los que se esperan temperaturas entre 21° y 27°.
La Distribución Exponencial
Exponencial (Geométrica para variables continuas)
• “Tiene comportamiento exponencial
• Generalmente se utiliza para modelar tiempo
Comando
Para calcular utilizando Excel debemos utilizar:
=DISTR.EXP.N(x ; lambda ;1)
Al realizar dicho comando se obtiene la probabilidad para los valores menores o iguales al
tiempo utilizado. Además, hay que notar que lambda sería el promedio según la unidad de
tiempo.
• El tiempo que transcurre antes de que una persona sea atendida en una cafetería es
una variable aleatoria que tiene una distribución exponencial con una media de 4
minutos.
¿Cuál es la probabilidad de que un cliente sea atendido antes de 3 minutos en un día
cualquiera? ¿Cuál es la probabilidad de que una persona no sea atendida antes de 2
minutos en un día cualquiera?
Si se desea saber una cantidad 𝑥 de éxitos con una probabilidad de éxito 𝑝, probabilidad de
fracaso 𝑞=1−𝑝 a través de 𝑛 intentos o ensayos, entonces, la distribución de probabilidad
de la variable aleatoria 𝑋 está dada por:
=𝐷𝐼𝑆𝑇𝑅.𝐵𝐼𝑁𝑂𝑀.𝑁(𝑥;𝑛;𝑝;0)
NOTA: Depende de la idioma del software y de su versión la probabilidad debe ser escritas
con coma o con punto y la separación entre cada elemento con punto y coma o con coma,
ese comando funciona para el idioma ESPAÑOL (Costa Rica)