Clases de Analisis I Total
Clases de Analisis I Total
Clases de Analisis I Total
DESARROLLO DE CLASES
LA IMPORTANCIA DE LA ESTADISTICA Y QUIEN LA UTILIZA.
Es comn en nuestro pas, cada vez que vamos a elecciones
presidenciales, diputados, alcaldes, or decir a ciertas personas, cual x
o y candidato tiene posibilidades de ganar la eleccin, en ese momento,
eventualmente presentar proyecciones de intencin de voto al momento
de practicarse las elecciones quien puede ganar, como x candidato va
perdiendo posibilidades de ganar o a la inversa. Otro aspecto importante
es, que en esas predicciones se habla de un margen de error.
1
Existen tres tipos de mentiras: mentiras ordinarias, las grandes mentiras
y la estadstica, porque en la vida se dan varios fracasos estadsticos si
se usa incorrectamente. (Dar un ejemplo)
HISTORIA
Palabra italiana estatista que significa estadstica. Se empez a utilizar
entre los aos 1719-1772.
SUBDIVISION DE LA ESTADISTICA
La estadstica se divide en dos grandes categoras:
2
En primera instancia es necesario aplicar tcnicas para tabular y graficar
para organizacin de datos y posteriormente mostraremos como usar
nmeros para describir datos.
RECOLECCION DE DATOS
Hay que seleccionar las observaciones de manera que todos los grupos
relevantes estn representados en los datos. Si se hace un estudio de
mercado, debe estar seguro de que el grupo seleccionado incluya las
personas que representan las distintas variables como nivel de
ingresos, raza, nivel educativo, vecindario, etc.
DAR EJEMPLOS
3
Al final debemos determinar si los datos vale la pena usarlos o debemos
esperar y recabar mas informacin antes de actuar. Un ejemplo clsico
es enfocar la publicidad a segmentos de mercado que no corresponden.
DAR EJEMPLOS
4
Cuando ms informacin podamos obtener de la muestra, mejor
podremos entender la poblacin de la cual proviene, y mejor ser
nuestra toma de decisiones.
LA DISTRIBUCION DE FRECUENCIAS
Una manera de compactar datos es mediante una Tabla de Frecuencias
o distribucin de frecuencias.
6
Clase (grupo de valores parecidos Frecuencia (Numero de
de datos puntuales. observaciones que hay en cada
clase)
2.0 a 2.5 1
2.6 a 3.1 0
3.2 a 3.7 2
3.8 a 4.3 8
4.4 a 4.9 5
5.0 a 5.5 4
Que informacin podemos obtener se esta tabla:
1. Perdimos algo de informacin al construir la tabla de frecuencias.
No podemos saber cmo se repite puntualmente el 5.5.
2. Podemos observar que 8 tiendas tiene un promedio de existencias
entre 3.8 y 4.3.
3. No es usual encontrar existencias entre 2.6 y 3.1.
4. Las existencias entre 2.0 y 3.7 son las que no prevalecen.
5. Podremos construir diferentes tablas con cantidades de clases
diferentes.
7
Podemos observar que las tiendas que tienen existencias entre 3.8 y
4.3 representan el 40% y as podemos hacer muchos anlisis.
Observaciones:
1. El nmero de clases uno lo determina, y para calcular el intervalo
se usa la siguiente frmula:
5.52.0
Intervalo de clase = = = 0.50 en el
+1 6+1
caso anterior
HISTOGRAMA
Son una serie de rectngulos, cuyo ancho es proporcional al rango de
los valores que se encuentran dentro de una clase y la altura es
proporcional al nmero de elementos que caen dentro de la clase. Si las
clases son iguales en su ancho, todas las barras tendrn el mismo
ancho.
8
Clase Frecuencia
2.0 a 2.5 1
2.6 a 3.1 0
3.2 a 3.7 2
3.8 a 4.3 8
4.4 a 4.9 5
5.0 a 5.5 4
1.2
0.8
0.6
0.4
0.2
POLIGONOS DE FRECUENCIAS
Se Utiliza menos, pero es otra forma de presentar grficamente tanto
de frecuencias como frecuencias relativas. Son lo mismo que el
Histograma. Lo nico es que se traza una lnea usando como referencia
el punto medio de cada clase as:
9
4.65 5
5.25 4
5.8 0
Frecuencia
9
8
7
6
5
4 Frecuencia
3
2
1
0
1 2 3 4 5 6 7 8
OJIVA
Una distribucin de frecuencias acumuladas nos permite ver
cuntas observaciones estn por encima de ciertos valore, en
10
lugar de hacer un mero registro del nmero de elementos que
hay dentro de los intervalos.
El procedimiento es construir una tabla de frecuencias menores
que y se muestra en la siguiente tabla:
Menor de 2.5 0
Menor de 3.1 1
Menor de 3.7 1
Menor de 4.3 3
Menor de 4.9 11
Menor de 5.5 16
Menor de 6.0 20
25
20
15
10 Series1
0
Menor Menor Menor Menor Menor Menor Menor
de 2.5 de 3.1 de 3.7 de 4.3 de 4.9 de 5.5 de 6.0
11
Observe que a partir de un inventario de 4.3 son ms las tiendas que
tienen un inventario mayor.
Distribucion C
Distribucion A
Eje X
Eje X
Distribucion B
12
Observe que la distribucin A es no es igual a la Distribucin pero estn
perfectamente distribuidas, por lo tanto les corresponde igual punto
medio. Sin embargo la distribucin C el punto medio esta sesgado hacia
la derecha.
13
Podemos calcular la media de las ventas considerando que son datos
no agrupados o sea datos simples.
7+23+4+8+2+12+6+13+9+4+16+22
= = = 10.5
12
Observe lo siguiente:
= smbolo de la media de una poblacin.
x = suma de los valores de todas las observaciones o datos
N = nmero de elementos de la poblacin. Por eso N es mayscula
14
50.00 99.99 75.00 x 123 = 9,225
100.00 149.99 125.00 x 187 = 23.375
150.00 199.99 175.00 x 82 = 14,350
200.00 249.99 225.00 x 51 = 11,475
250.00 299.99 275.00 x 47 = 12,925
300.00 349.00 325.00 x 13 = 4,225
350.00 399.99 375.00 x 9 = 3,375
400.00 449.99 425.00 x 6 = 2,550
450.00 499.99 475.00 x 4 = 1,900
TOTALES 600 85,350
Ff (f * x)
85,350
= = L 142.25 es la media de la muestra.
600
CODIFICACION
En los casos de no tener disponible una computadora y sea necesario
realizar las operaciones a mano, se puede simplificar el clculo de la
media aritmtica de datos agrupados, con la tcnica de Codificacin.
Podemos eliminar el problema de tener puntos medios muy grandes o
inconvenientes. La tcnica consiste en asignar enteros consecutivos de
valores pequeos, llamados cdigos, a cada uno de los puntos medios.
El entero 0 se le puede asignar a cualquier punto medio, o sea a la mitad
de la distribucin o el ms cercano al punto medio.
Ejemplo:
Clase Cdigo
1-5 -4
6-10 -3
11-15 -2
16-20 -1
21-25 0
26-30 1
31-35 2
36-40 3
41-45 4
15
La ubicacin del punto medio, cuando las clases son impares es mas
fcil.
Formula:
()
= X0 + w
Donde:
= media de la muestra
X0 = valor del punto medio al que se le asigno el cdigo 0
W = Ancho numrico del intervalo de clase
= cdigo asignado a cada punto medio de la clase
f = frecuencia o numero de observaciones de cada clase
n = nmero total de observaciones de la muestra
16
total 20 5
f =n (u * f)
Desarrollo formula:
5
= 19.5 + 8( ) = 21.5 Si nos referimos a edades esta seria la edad
20
promedio de un grupo x.
MEDIA PONDERADA
Al calcular la Media Aritmtica se asume que los datos del conjunto son
iguales en importancia. En algunos casos es evidente que algunas
observaciones son ms importantes que otras. Ejemplo clsico son el
ndice acadmico de los alumnos, unas clases tienen un valor de 5
unidades valorativas y otras 4 unidades. Otro ejemplo son los exmenes
parciales que no tienen el mismo peso. Esto es lo que considera la
media ponderada, asignarle a cada observacin su valor relativo.
Ejemplo:
Las notas de cada parcial estn valuadas en 25, 35 y 40%
respectivamente.
17
Formula:
w =
Donde:
= es la media ponderada.
X = es la observacin individual.
W = el peso o ponderacin asignada a cada observacin.
MEDIA GEOMETRICA
Muestra los cambios porcentuales de una serie de nmeros positivos.
Tiene aplicacin en los negocios y la economa, debido a que con
frecuencia se est interesado en establecer el cambio porcentual en las
ventas, en el producto nacional bruto o en cualquier serie econmica.
Porcentaje sobre ao
AO VENTAS anterior
2004 50,000 -
2005 55,000 55/50 = 1.10
2006 66,000 66/55 = 1.20
2007 60,000 60/66 = 0.91
18
2008 78,000 78/60 = 1.30
19
Ejemplo:
Proyectar los aos 2009 y 2010 as:
2009 78,088 X 1.1179 = L 87,295
2010 87,295 X 1.1179 = 97,587
LA MEDIANA
Es diferente a las anteriores. La mediana es solo el valor del conjunto
de datos que mide la observacin central del conjunto. Es la
observacin que est ms centrada. La mitad estn por arriba de ella y
la otra mitad de datos estn por debajo ella.
Ejemplo:
Los costos en millones de varios aos se muestran abajo:
45,52,56,67,67
En el caso que los datos sean un nmero par los dos datos centrales se
suman y se dividen entre 2
Ejemplo:
35,45,52,56,67,67: La posicin de la Mediana es:
20
6+1
Posicin de la Mediana = = 3.5
2
Formula:
2
Mediana = Lmd + ( )
Donde:
Lmd = el lmite inferior de la clase de la mediana.
F = es la frecuencia acumulada de la clase que antecede a la clase de
la mediana.
F = la frecuencia de la clase mediana.
C = intervalo de la clase mediana.
21
2. Encontrar la clase mediana cuya frecuencia acumulada es mayor
o igual a n/2
3. Aplicar la formula.
Clase modal = n/2 = 50/2 = 25. La mayor frecuencia acumulada que
comprende a 25 es 28, por lo tanto la clase modal ser 70-79
50
10
2
Mediana= 70 + ( )10 = 78.33
18
LA MODA
Es diferente a la media, pero parecida a la medina. Es el valor que ms
se repite en el conjunto de datos.
Ejemplo:
Despus de organizar los datos estos se muestran como ejemplo de
viajes que hacen un grupo de personas:
22
1,1,2,2,4,4,5,5,6,6,7,7,8,12,15,15,15,19
En los casos que varios datos se repitan al igual, en este caso se dice
que la distribucin de datos tiene 2 modas. Se dice que es Bimodal. En
los casos que sean ms de dos, se dice que es Multimodal.
Donde:
Lmo = Lmite inferior de la clase modal.
d1 = Frecuencia de la clase que se encuentra inmediatamente menor
que ella.
d2 = frecuencia de la clase modal menos la frecuencia de la clase
inmediatamente mayor que ella.
W = Ancho del intervalo de la clase modal.
Ejemplo:
No.
Entregas 0-3 4-7 8-11 12 o mas
Frecuencia 6 8 1 5
Clase Modal
Si deseamos saber no solo la clase modal que es 4-7 entregas,
deseamos conocer La Moda, aplicamos la formula as:
86 2
Mo = 4 + ((86)+1 =4 + 0.6667 o =4.667 entregas
3
24
2. Ya que existen problemas caractersticos para datos muy
dispersos, se debe ser capaz de reconocer esa dispersin amplia
para poder abordar el problema.
3. Quiz se desee comparar las dispersiones de diferentes
muestras.
RANGO
Es la diferencia entre el valor ms alto y ms pequeo de los valores
observados.
RANGO INTERFRACTIL
Es una distribucin de frecuencias, una fraccin o proporcin dada de
los datos cae en un fractil o debajo de este. La media por ejemplo, es el
fractil 0.5, porque la mitad del conjunto de datos es menor o igual a ese
valor. Ejemplo el 25% de los datos estar en el fractil 0.25.
Ejemplo:
Estos son los pagos al seguro social por mes:
25
Primer Tercio Segundo Tercio Ultimo Tercio
863 1,138 1,698
903 1,204 1,745
957 1,354 1,802
1,041 1/3 fractil 1,624 2/3 fractil 1,883 ultimo fractil
RANGO INTERCUARTIL
El rango Intercuartil mide aproximadamente que tan lejos de la medina
debemos ir en cualquiera de las dos direcciones antes de recorrer una
mitad de los valore del conjunto de datos.
1. Dividimos nuestros datos en cuatro parte (25% de los datos en
cada bloque)
2. Los valores ms altos de cada una de las cuatro partes.
3. El rango intercuartil es la diferencia entre los valores del primero
y el tercer cuartil.
Rango intercuartil = Q3 Q1
Ejemplo:
Los datos son los siguientes:
59 65 6768 71 72 75 79 81 83 85 87 88 91 92 93 94 95 100 100
Son 20 los datos y si los dividimos en cuatro partes, a cada cuartil ser
de 5 datos:
Esto quiere decir que los datos de cada cuartil sern:
1er Cuartil = 59,65,67,68,71
2do Cuartil = 72,75,79,81,83
3er Cuartil = 85,87,88,91,92
4to Cuartil = 93,94,95,100,100
Diferencia =Q3 Q1 = 92 71 = 21
VARIANZA DE POBLACION
Cada poblacin tiene una varianza, su smbolo es 2 (sigma cuadrada)
1. Se calcula la media del conjunto.
2. Se resta la media y cada dato del conjunto.
3. Como algunos datos del inciso anterior resultan negativos, se
elevan al cuadrado estos para convertirlos en positivos.
4. La suma de todos estos valores son la varianza de la poblacin
Formula:
()2 2
2 = = - 2
Donde:
2 = varianza de la poblacin
X = elementos u observaciones.
= media de la poblacin.
N = nmero total de elementos de la poblacin
()2
= suma de todos los valores para calcular 2
27
la desviacin y que sea menos confusa. Esta medida se le conoce como
desviacin estndar y es la raz cuadrada de la varianza.
Esto nos dara como resultado las mismas unidades que los datos
originales.
Ejemplo:
El SANAA, realiza un anlisis del agua para encontrar impurezas en la
misma. Se extraen 15 muestras y los resultados fueron:
Desviacin
al Observaciones
Impurezas Media Desviacin Cuadrado al cuadrado
2 2
(x) u=2.49/15 (x-u) ( ) ( )
0.04 0.166 - -0.126 = 0.016 0.0016
0.06 0.166 - -0.106 = 0.011 0.0036
0.12 0.166 - -0.046 = 0.002 0.0144
0.14 0.166 - -0.026 = 0.001 0.0196
0.14 0.166 - 0.026 = 0.001 0.0196
0.15 0.166 - 0.016 = 0.000 0.0225
0.17 0.166 - 0.004 = 0.000 0.0289
0.17 0.166 - 0.004 = 0.000 0.0289
0.18 0.166 - 0.014 = 0.000 0.0324
0.19 0.166 - 0.024 = 0.001 0.0361
0.21 0.166 - 0.044 = 0.002 0.0441
0.21 0.166 - 0.044 = 0.002 0.0441
0.22 0.166 - 0.054 = 0.003 0.0484
0.24 0.166 - 0.074 = 0.005 0.0576
0.25 0.166 - 0.084 = 0.007 0.0625
2.49 0.051 0.4643
x ( )2
2
0.051
2 = = 0.0034
15
= 0.0034 = 0.058%
29
0.1080.166
Resultado estndar = = -1
0.058
Para finalizar podemos decir que una impureza del 0.282% se desva
de la media en 2(0.058) = 0.116 unidades, que es igual a + 2, en
trminos de del numero de desviaciones estndar alejado de la media.
La frmula es:
()2 2
2 = = - 2
= 2
Ejemplo:
Punt Frecuenci
Clase o af f*x Media x- u ( )2 f( 2 )
Medi
o
700-799 750 4 3,000 1,250 -500 250,000 1,000,000
800-899 850 7 5,950 1,250 -400 160,000 1,120,000
900-999 950 8 7,600 1,250 -300 90,000 720,000
1,000-1,099 1,050 10 10,500 1,250 -200 40,000 400,000
1,100-1,199 1,150 12 13,800 1,250 -100 10,000 120,000
1,200-1,299 1,250 17 21,250 1,250 0 0 0
1,300-1,399 1,350 13 17,550 1,250 100 10,000 130,000
1,400-1,499 1,450 10 14,500 1,250 200 40,000 400,000
1,500-1,599 1,550 9 13,950 1,250 300 90,000 810,000
1,600-1,699 1,650 7 11,550 1,250 400 160,000 1,120,000
1,700-1,1,799 1,750 2 3,500 1,250 500 250,000 500,000
1,800-1,899 1,850 1 1,850 1,250 600 360,000 360,000
100 125,000 6,680,000
125,000
2 = = 1,250 millones (media)
100
30
6,680,000
2 = = 66,800 millones (Varianza)
100
Formula:
( )2 2 2
2 = = - Varianza
1 1 1
S = 2 Desviacin estndar
Donde:
2 = Varianza de la muestra
s = Desviacin estndar de la muestra
x = valor de cada una de las n muestras
= media de la muestra
n-1 = Numero de observaciones de la muestra menos 1
Ejemplo:
Estos son los gastos en publicidad de una empresa
Gasto (x)
Media () x- 2
( ) 2
863 1,351 -488 238,144 744,769
903 1,351 -448 200,704 815,409
957 1,351 -394 155,236 915,849
1,041 1,351 -310 96,100 1,083,681
1,138 1,351 -213 45,369 1,295,044
1,204 1,351 -147 21,609 1,449,616
1,354 1,351 3 9 1,833,316
1,624 1,351 273 74,529 2,637,376
1,698 1,351 347 120,409 2,883,204
1,745 1,351 394 155,236 3,045,025
1,802 1,351 451 203,401 3,247,204
1,883 1,351 532 383,024 3,545,689
31
1,593,770 23,496,182
(
)2 2
1,593,770
2 = = 144,888 miles de lempiras Varianza
11
Formula:
Coeficiente de variacin de una poblacin = (100)
Ejemplo:
Un tcnico A realiza 40 reparaciones con una desviacin estndar de 5.
El tcnico B realiza 160 reparaciones con una desviacin estndar de
15. Cul de los dos tcnicos muestran menos variabilidad?
Ambos realizan actividades diferentes
Para el tcnico A
5
Coeficiente de variacin = (100) = 12.5% de variacin
40
Para el tcnico B
15
Coeficiente de variacin = (100) = 9.4 % de variacin
160
El tcnico a tiene una variacin absoluta menor, pero tiene una variacin
relativa menor.
32
ANALISIS EXPLORATORIO DE DATOS (AED)
Una de las tcnicas ms tiles del anlisis exploratorio, la grfica de
tallo y hoja, resuelve este problema de manera muy efectiva.
Proporciona el orden de calificaciones de los elementos del conjunto de
datos y la forma de distribucin.
40-49 1
50-59 3
60-69 5
70-79 8
80-89 6
90-99 3
Mayor 99 1
Para producir una grfica de tallos y hoja, se hace una lista vertical del
primer nmero de cada una de las clases.
4
5
6
7
8
9
10
4| 8
5| 017
6| 136
7| 12236889
8| 244579
9| 349
10| 0
ANALISIS CUANTITATIVO I
2DO PARCIAL
PROBABILIDAD
Fue aplicada en los juegos de azar, y posteriormente en el estudio de
problemas sociales y econmicos. Las compaas de seguros que
surgen en el siglo XIX, requera de un conocimiento preciso sobre los
riesgos de perdidas, con el fin de calcular las primas.
34
Desde el momento que actuamos bajo incertidumbre, la toma de
decisiones requiere de la teora de probabilidades, sea no algo muy
complejo. Todos los das omos que existe un 70% de probabilidad que
llueva, que x equipo tiene ms probabilidades de ganar, que un
candidato tiene 60% de preferencias en las elecciones, etc.
S = {cara, cruz}
TIPOS DE PROBABILIDADES.
Existen 3 maneras bsicas de clasificar las probabilidades, stas
representan planteamientos conceptuales bastante diferentes para el
estudio de la teora de probabilidad, los expertos no se ponen de
acuerdo sobre cul es el planteamiento ms apropiado. Empecemos
definiendo
1. El planteamiento clsico.(probabilidad)
2. El planteamiento de frecuencia relativa.
3. El planteamiento subjetivo.
PROBABILIDAD CLASICA
El planteamiento clsico define la probabilidad de que un evento ocurra
como:
Probabilidad de un evento =
36
escribir los ejemplos de lanzamiento de la moneda y de los dados de
una manera simblica. Primero plantearemos la pregunta Cul es la
probabilidad de obtener una cara en un solo lanzamiento? Como
1
P (cara) = = 0.5 = 50% donde 1 es el de obtener cara; el dos es todos
2
los posibles resultados.
37
Los eventos pasados se convierten en una probabilidad. Determinamos
que tan frecuentemente ha sucedido algo en el pasado y usamos una
cifra para predecir la probabilidad de que suceda de nuevo en el futuro.
HACER EJERCICIO
PROBABILIDAD SUBJETIVA
Est basada en las creencias de las personas que efectan la
estimacin de probabilidades. Se define como la probabilidad asignada
a cada evento por parte de un individuo, basado en las evidencias que
tenga disponible. Esta evidencia puede presentarse en forma de
frecuencias relativas de presentacin d eventos pasados o pude tratarse
de una creencia mediata. Ejemplo clsico es cuando salen las
candelillas, se dice que comienzan las lluvias. Es ampliamente flexible
que los otros conceptos analizados anteriormente. El tomador de
decisiones puede hacer uso de cualquier evidencia que tenga a mano y
mezclarla con los sentimientos personales sobre la situacin.
Se debe usar esta, cuando sucede una nica vez o el nmero de veces
es muy reducido.
38
REGLAS DE PROBABILIDAD
La mayora de los administradores que utilizan la probabilidad se
preocupan por dos condiciones:
1. El caso en que un evento u otro se presente.
2. La situacin en que dos o ms eventos se presenten al mismo
tiempo.
Ejemplos de la situacin 1.
Cul es la probabilidad que realizar mi boda el viernes y hay estado de
sitio a partir de las 9pm?
Cul es la probabilidad que se realice el examen el prximo domingo,
en las actuales condiciones?
Una probabilidad sencilla quiere decir que solo un evento puede llevarse
a cabo. Se le conoce como Probabilidad Marginal o Incondicional.
En las elecciones del 29 de noviembre existen 6 candidatos. Cualquiera
puede calcular la probabilidad de que 1 candidato sea electo:
1
P (Ganar) = = 0.16666 = 16.67% al no conocerse la intencin de boto,
6
ni se tiene percepcin que suceder.
39
El diagrama de Venn puede ilustrar esto:
Evento
A B A B
Dos eventos mutuamente Dos eventos no
Excluyentes Excluyentes
(a) (b)
Observe que el caso A, existen dos conjuntos que no tienen elementos
en comn, por lo tanto o es A o es B, por eso son mutuamente
excluyentes. Si observamos el caso b, los dos conjuntos se
interceptan, por lo tanto hay elementos de ambos conjuntos que son
comunes. Este caso es tratado en la siguiente regla.
40
Si calculamos una vez ms la probabilidad de que sucedan dos o ms
eventos. El tamao de una familia de un pueblo es necesario conocer
la probabilidad que cada familia tenga 4, 5, 6 o ms miembros.
41
Un naipe tiene 52 cartas, distribuidos en 4 ajuares (corazn negro,
corazn rojo, trbol y diamante) es decir 13 cartas de cada ajuar.
4 13 1 16 4
P (A o B) = + - = =
52 52 52 52 13
1. Marginal.(probabilidad)
2. Conjunta.
3. Condicional.
42
PROBABILIDAD CONJUNTA BAJO CONDICIONES DE
INDEPENDENCIA ESTADISTICA.
La probabilidad de que dos o ms eventos independientes se presenten
juntos o en sucesin es producto de sus probabilidades marginales.
Matemticamente se describe como:
0.
P(H) = 0.50 0.2
P(H)=0.5 5 P(H)55= 0.5 012
P(H)= 0.5
55
5
0.2
55
P(H)=0.5 0.12
5
P(T)= 0.5 0.
5.
Esta red muestra los 5cambios que experimenta la probabilidad a media
de se proyecta un nuevo lanzamiento.
43
El P(H)= 0.5 es la probabilidad conjunta de obtener una de las dos cara
en cada lanzamiento. El P(H1) para cada una de las posibilidades en el
segundo lanzamiento es la probabilidad marginal y as sucesivamente
en cada lanzamiento adicional.
P(B/A) = P(B)
44
PROBABILIDAD CONDICIONAL BAJO DEPENDENCIA
ESTADISTICA
La probabilidad condicional y conjunta bajo condiciones de dependencia
estadstica es ms complicada que la probabilidad marginal en estas
mismas circunstancias. Se analiza primero las probabilidades
condicionales, ya que la probabilidad conjunta se ilustra mejor si
utilizamos la probabilidad condicional como base.
Ejemplo 1:
En una caja hay 10 bolas distribuidas as:
Ejemplo 2:
Cuando utilizamos el ejemplo de las bolas de color y grises,
respondemos a las preguntas, Cul es la probabilidad de P(D|G), es
decir que de las bolas grises tengan puntos y P(S|G), que de las grises
tengan franjas?
Donde:
D = Son grises y tienen puntos
G = grises
() 0.2 1
Solucin: P(D/G) = = =
() 0.6 3
Donde:
45
SG = grises y tiene franjas
G = Grises
() 0.4 2
P(S/G) = = =
() 0.6 3
Se debe considerar que si la bola que sali es gris solo es posible con
franjas o puntos.
Ejemplo No. 3
Calcule P(G|D) y P(C|D)
(|) 0.2
P(G|D) = = = 0.4
() 0.5
() 0.3
P(C|D) = = = 0.6
() 0.5
Total 1.0
Ejemplo No. 4
() 0.4
P(C|S) = = = 0.8
() 0.5
Total 1.0
46
Probabilidad de que se presente el evento A
47
Igualmente, podemos calcular la probabilidad marginal del evento bola
con puntos mediante la suma de las probabilidades de los eventos
conjuntos en los que se tiene una bola con puntos.
48
Las probabilidades son alteradas despus que uno obtiene informacin
adicional. Las nuevas probabilidades se conocen como probabilidades
revisadas o posteriores. Como estas pueden revisarse en la medida que
hay ms informacin, la teora de las probabilidades adquiere una gran
importancia para la toma de decisiones.
Fue Tomas Bayes quien formul este concepto. La frmula bsica para
la probabilidad condicional en circunstancias de dependencia es:
()
P(B|A) = se conoce como teorema de Bayes.
()
0.20
P(varn) = = = 0.364 o 36.4%
0.55
0.35
P(mujer) = = = 0.636 o 63.6%
0.55
50
Probabilida
P1(sexo P2( P(2 sexo,
Evento d del
|evento sexo|evento evento
Element evento
elemental) elemental) elemental)
al elemental
0.16x0.5=
Varn 0.5 0.4 0.16
0.080
Mujer 0.5 0.7 0.49 0.49x0.5=0.245
P(2
1.0
bola)=0.325
Nota: la tercera columna es la segunda elevada al cuadrado. Ejemplo
0.4 x 0.4 = 0.16 y 0.7 x 0.7 = 0.49
Podemos obtener informacin adicional sobre los nacimientos.
Supongamos que realizo nuevamente el evento Cul es la
probabilidad de el nio que nazca sea varn?
0.245
P(mujer) = = = 0.754 0 75.4%
0.325
Esto se debe que si uno observa en un hospital da a da cambia la
cantidad de nacimientos, en algunos casos nacen mas varones y otros
ms mujeres o en cantidades similares. Hay factores que producen este
fenmeno.
51
Cul es la probabilidad que la cajera tenga operaciones correctas? El
cuadro siguiente muestra los clculos.
P(evento,
Evento P(evento) P(ambiente|evento) P(3|evento)
3)
0.6141 x
Correctas 0.75 0.85 0.6141 0.75 =
0.4606
0.0429 x
Incorrectas 0.25 0.35 0.0429 0.25 =
0.0107
1.0 0.4713
Nota. La segunda columna se eleva al cubo = 0.85 x 0.85 x 0.85 =
0.6141
0.0107
P(incorrecta) = = = 0.023 = 2.3%
0.4713
P(evento P(evento,sbbbb
Evento P(S|evento) P(sbsss|evento)
) )
.85x0.15x0.85x0.8 0.07830x0.75 =
Correcta 0.75 0.85
5x.85 = 0.07830 0.05873
Incorrect 0.35x0.65x0.35x0. 0.00975x0.25 =
0.25 0.35
a 35x0.35 = 0.0095 0.00244
P(sbsss) =
0.06117
52
0.05873
P(correcta) = = = 0.9601 o 96%
0.06117
VALOR ESPERADO
CONBINACION DE PROBABILIDADES Y VALORES MONETARIOS
Esto es aplicable ms a productos perecederos.
Ejemplo:
Una caja de frambuesas cuesta L 20 y el vendedor recibe L 50 por ella.
Este no puede especificar el nmero de cajas que un cliente en
cualquier da dado, pero su anlisis de registros pasados ha producido
la informacin que se presentan en la siguiente tabla:
Probabilidad de
Nmero de das de
Ventas Diarias ventas de cada
venta
cantidad
10 15 0.15
11 20 0.20
12 40 0.40
13 25 0.25
Totales 100 1.00
Opciones de existencia
Posibles
Peticiones
10 11 12 13
de
frambuesas
10 L0 L 20 L 40 L 60
53
11 30 0 20 40
12 60 60 30 0
55
Posibles Perdida estas Perdida
solicitudes condicional solicitudes Esperada.
10 60 X 0.15 = 9.00
11 40 X 0.20 = 8.00
12 20 X 0.40 = 8.00
13 0 X 0.25 = 0.00
25.00
Al tener una existencia de 13 cajas, las perdidas mnimas serian de L
25.00
GANACIA MAXIMA
Probabilidad de cada
Ventas Diarias No. De das que se nmero que se venda
venden
10 15 0.15
11 20 0.20
12 40 0.40
13 25 0.25
56
1.00 300
57
TERCER PARCIAL
DISTRIBUCION DE PROBABILIDADES
DISTRIBUCION BINOMIAL
Una distribucin de probabilidad de variable aleatoria discreta
ampliamente utilizada en la distribucin Binomial. Es una variedad de
procesos de inters para los administradores. Los datos discreto, no
continuos, que son resultados de un experimento conocido como
proceso de Bernoulli. El xito o fracaso de las solicitudes de empleo,
entrevistados para pruebas de aptitudes, puede ser descrito como un
proceso Bernoulli. Si medimos la duracin de focos mediante una escala
continua de tiempo y no se podra clasificar como una distribucin
Binomial.
58
1. Cada intento (cada lanzamiento, es este caso) tiene solamente
dos resultados posibles: cara o cruz, si o no, xito o fracaso.
2. La probabilidad del resultado de cualquier intento permanece fijo
con respecto al tiempo. Al no estar alterada la probabilidad de
ambas es 0.5, independientemente del nmero de veces que se
lance la moneda.
3. Los intentos son estadsticamente independientes, es decir, el
resultado de un lanzamiento no afecta el resultado de cualquier
otro.
59
! 3!
Probabilidad de r xitos en n intentos = =
!()! 2!(32)!
2 1
(0.5 )(0.5 )
321
= (21)(11) (0.25)(0.5) = 0.375
p = 0.8
q = 0.2
r=3
n=6
6!
Probabilidad de r xitos de n intentos = (0.8)3 (0.2)3 0.08192 =
3!(63)!
8.19%
5!
P(1) = (0.4)1 (0.6)4 = 0.2592
0!(51)!
60
5!
P(2) = (0.4)2 (0.6)3 = 0.3456
0!(52)!
5!
P(3) = (0.4)3 (0.6)2 = 0.2304
3!(53)!
5!
P(4) = (0.4)4 (0.6)1 = 0.0768
4!(54)!
5!
P(5) = (0.4)5 (0.6)0 = 0.01024
5!(55)!
0.4
0.35
0.3
0.25
0.2
Series1
0.15
0.1
0.05
0
1 2 3 4 5 6
62
La respuesta es que la probabilidad de que 8 o ms votantes
empadronados no voten es de 0.0501.
u = np
donde:
n = nmero de ensayos.
P = probabilidad de tener xito
u = np = (10)(0.2) = 2 es la media
= = (10)(0.20)(0.80) = 1.265 desviacin estndar
63
Usar la distribucin Binomial, se debe estar seguro que cumpla con las
3 condiciones necesarios, especialmente la 2 y 3. La 2 establece que
cualquier intento la probabilidad debe ser fija, situacin difcil de cumplir
y la 3 que sea estadsticamente independiente, es decir, que el
resultado de un evento no dependa del resultado de otros.
LA DISTRIBUCION DE POISSON
Existen muchas distribuciones de probabilidades discretas, pero el
anlisis se centra en la Binomial y la Poisson.
Se utiliza para describir ciertos tipos de procesos, entre los que se
encuentran la distribucin de las llamadas telefnicas a un conmutador,
las solicitudes de pacientes que requieren un servicio, los automviles
que llegan a una caseta de peaje. Todos tiene en comn que pueden
ser descritos mediante una variable aleatoria discreta que toman valores
enteros (0, 1 ,2, 3, ..n)
64
d. El nmero de llegadas en cualquier intervalo de un segundo
no depende del nmero de llegadas en cualquier otro
intervalo de un segundo.
Se puede generalizar a partir del ejemplo de una caseta de peaje y
aplicar esta caracterstica a otros procesos. Si estos nuevos procesos
cumplen con las mismas condiciones, entonces podemos utilizar la
distribucin de probabilidad de Poisson para describirlos.
Lambada (el nmero medio de presentaciones por e o 2.71828 (base de los logaritmos
Intervalos de tiempo) elevada a la x potencia neperianos o naturales) elevados a la
Lambada potencia negativa
P(x) =
!
65
(5)2 ( 5 )
P(2) = = 0.08425
2 1
Igual situacin se presenta si queremos saber que probabilidad hay
que ocurra 2 o menos accidente:
P(0) = 0.00674
P(1) = 0.03370
P(2) = 0. 08425
TOTAL 0.12469
BUSQUEDA DE PROBABLIDADES DE POISSON UTILIZANDO LA
TABLA 4b DEL APENDICE.
Es utilizar la tabla 4a en las mismas condiciones que la tabla de
distribucin Binomial.
Ejemplo:
X= nmero de P(x) = Probabilidad de tener exactamente este
accidentes nmero de accidentes.
0 0.00674
1 0.03370
2 0.08425
3 0.14042
4 0.17552
5 0.17552
6 0.14627
7 0.10448
8 0.06530
9 0.03628
10 0.01814
11 0.00824
TOTAL 0.99486 probabilidades de tener de 0 a 11
accidentes.
0.00514 probabilidad de tener 12 o mas accidentes
TOTAL 1.00000
66
1.2
0.8
0.6
0.4
0.2
0
1 2 3 4 5 6 7 8 9 10 11 12
()
P(x) =
!
Ejemplo:
En un hospital hay 20 aparatos para dilisis y que la probabilidad de que
cualquiera de las maquinas no funcione bien durante un da cualquiera
es de 0.02. Cul es la probabilidad de que exactamente tres maquinas
estn fuera de servicio?
67
20!
P(3) = (0.2)3 (0.98)17 = 0.0065 Probabilidad Binomial
3!(203)!
68
La siguiente grafica muestra estas caractersticas:
Curvas de frecuencia para la distribucin normal de probabilidades
Curvas de
Media
Mediana
Moda
La distribucin normal de
Probabilidad es simtrica con
Respecto a una lnea vertical
La cola izquierda se Que pase por la media
Extiende de manera
Indefinida y nunca toca
El eje horizontal
69
La siguiente grafica muestra tres distribuciones normales de
probabilidades, cada una de las cuales tiene la misma media, pero
diferentes desviaciones estndar. Aunque estas curvas difieren en
apariencia, las tres son curvas normales.
La curva A tiene una desviacin
Estndar muy pequea
= 1
La curva B tiene una desviacin
Estndar mas grade
= 10
U = 50
70
La curva A tiene una La curva B tiene una La Curva C tiene una
Media y una desviacin Media y desviacin Media y una desviacin
Estndar pequea. Estndar mas grande Estndar muy grande
71
GRAFICA PARA 2 DESVIACIONES ESTANDAR
2 2
3 3
La tabla 1 del apndice del libro se muestra el rea bajo la curva normal
entre la media y cualquier variable aleatoria distribuida. Observe en esta
tabla la localizacin de la columna identificada como z. El valor de z se
calcula:
z=
x = valor de la variable aleatoria que nos preocupa.
u = media de la distribucin de la variable aleatoria.
= Desviacin estndar de la distribucin.
z = Numero de desviaciones estndar que hay desde x a la media de
distribucin.
Ejemplo de la tabla
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08
1.5 o.4332
Note que se usa la columna 0.00 por no estimar ningn margen de error.
La grafica es:
74
U = 500 horas
= 100 horas
U=500 650
P(500
a 600)
La grafica es:
75
U = 500 horas
= 100 horas
u = 500 700
En la tabla es 0.1915
Entonces:
P(650 550) = 0.4332 0.1915 = 0.2417
76
La Grafica se muestra as:
U = 500 horas
= 100 horas
Entonces,
77
U = 500 horas
= 100 horas
u= 500 580
En la tabla es 0.2881
Entonces,
78
La probabilidad que se tarden entre 420 y 580 horas es de 54.61%
Una de las reglas es que nunca toca el eje horizontal, y significa que
siempre existir una probabilidad aunque sea muy pequea de que la
variable aleatoria tome un valor grande y por consiguiente muy alejado
de la media como por ejemplo una persona que pese 2,000 kilogramos
y esto significa que las desviaciones estndar serian muy grades (50) y
tendra una probabilidad de 250 ceros justo despus del punto decimal,
pero debemos estar claros que podemos asignar valores imposibles en
la prctica.
79
cada ensayo es independiente y pude tener dos resultados mutuamente
excluyentes (xito, fracaso, etc.)
INTRODUCCION AL MUESTREO
Algunas veces es posible y practico examinar a cada persona o
elemento de la poblacin que deseamos describir. Esta accin se
conoce enumeracin completa o censo. Se recurre al muestreo cuando
no es posible o medir todos los elementos de la poblacin.
ESTADISTICA Y PARAMETROS
Matemticamente, podemos describir muestras y poblaciones al
emplear mediciones como la media, la mediana, la moda y la desviacin
estndar. Cuando estos trminos describen las caractersticas de una
muestra, se denominan estadsticas. Cuando describen las
caractersticas de una poblacin, se llama parmetros. Una estadstica
es una caracterstica de una muestra y un parmetro es una
caracterstica de una poblacin.
80
Los especialistas en estadstica emplean literal letras latinas minsculas
para representar estadstica de muestras. Y literales griegas o latinas
maysculas para representar parmetros de la poblacin. El siguiente
cuadro muestra la simbologa a emplear:
Poblacin Muestra
Definicin Coleccin de elementos Parte o porcin de la poblacin
considerados. seleccionada para su estudio
Caractersticas Parmetros Estadsticas
Smbolos Tamao de la poblacin = N Tamao de la Muestra = n
Media de la poblacin = u Muestra de la Poblacin =
Desviacin estndar de la Desviacin estndar de la muestra = s
poblacin =
TIPOS DE MUESTREO
Existen des mtodos para seleccionar muestras de una poblacin:
1. El muestreo no aleatorio o de juicio.
2. El muestreo aleatorio o de probabilidades.
En el probabilstico, todos los elementos de la poblacin tienen la
oportunidad de ser escogidos para la muestra. El muestreo de juicio, se
emplea el conocimiento y la opinin personal para identificar a los
elementos de la poblacin que deben incluirse en la muestra.
MUESTRAS SESGADAS.
Para ejemplarizar, lo que sucede con los periodistas en los problemas
actuales. Debo consultar a determinados periodistas para mostrar una
opinin de la poblacin. Definitivamente la muestra de opinin estar
sesgada, basada en la inclinacin que tienen la mayora de periodistas.
Igual situacin se presenta si yo quiero formarme una opinin poltica,
basado en lo que externan las personas que escuchan determinado
81
programa. Normalmente quienes escuchan esa emisora, son los que
quieren or lo que esperan. Definitivamente esta sera una muestra
sesgada.
MUESTREO ALEATORIO
En una muestra aleatoria o de probabilidad conocemos las posibilidades
de que un elemento de la poblacin se incluya o no en la muestra. Como
resultado de lo anterior, es posible determinar objetivamente las
estimaciones de las caractersticas de la poblacin que resultan de una
muestra dada, es decir, se puede describir matemticamente que tan
objetivas son las estimaciones correspondientes. Comencemos a
analizar este proceso introduciendo cuatro mtodos del muestro
aleatorio.
Estudiantes A, B, C y D
Muestras posibles de dos personas: AB, AC, AD, BC, BD, CD
La probabilidad de extraer esta muestra de dos personas debe ser
1
P(AB) = 6
1
P(AC) = 6
82
1
P(AD) = 6 solo hay dos muestras posibles de dos
personas
1
P(BC) =
6
1
P(BD) = 6
1
P(CD) = 6
3 1
P(A) = P(AB) + P(AC) + P(AD) = =
6 2
83
Supngase que tengo que escoger de 100 empleados 10. Como es de
2 dgitos, me remito a la tabla y voy escogiendo de la primera columna
los diez posibles candidatos, tomando de la primera columna los dos
primeros dgitos y estos seria: 15, 09, 41. Como se agot la tabla hacia
abajo, procedo a escoger los siguientes dos dgitos, estos seria: 81, 28
y 12, y continuo con los siguientes dos dgitos as: 92, 10, 07 y por ultimo
para completar los diez seria de los otros dgitos: 23.
MUESTREO SISTEMATICO
En el muestreo sistemtico, los elementos son seleccionados de la
poblacin dentro de un intervalo uniforme que se mide con respecto al
tiempo, al orden o al espacio. Si tuviera la lista de alumnos de la carrera
escogera aleatoriamente el primero con el nmero 20 y as
sucesivamente 40, 60, etc.
Pero tiene sus ventajas, este mtodo puede requerir menos tiempo y un
costo menor.
MUSTREO ESTRATIFICADO
Para utilizar el muestreo estratificado, dividimos la poblacin en grupos
relativamente homogneos, llamados estratos. Despus se utiliza
cualquiera de los dos planteamientos: o se selecciona aleatoriamente,
en cada estrato, el nmero especfico correspondiente a la proporcin
de la poblacin de cada estrato, o se extrae el mismo nmero de cada
estrato y despus ponderamos los resultados considerando la
proporcin que el estrato representa de la poblacin.
84
La ventaja de las muestras estratificadas es que, cuando se disea
adecuadamente, refleja de manera ms precisa las caractersticas de la
poblacin de la cual fue elegida, en comparacin con otro tipo de
muestras.
MUESTREO DE RACIMOS
En el muestreo de racimo dividimos la poblacin en grupos, o racimos,
y luego seleccionamos una muestra aleatoria de estos racimos,
asumiendo que cada uno de ellos es representativo de la poblacin. Por
ejemplo establecer el promedio de televisores por casa en una ciudad
grande, podemos usar un mapa de la ciudad para dividir el territorio en
manzanas y luego escoger un cierto nmero de estas (racimos) para
entrevistar a los habitantes. Un muestreo de racimos bien diseado
puede producir una muestra mas precisa a un costo considerable menor
que un muestreo aleatorio simple.
DISEO DE EXPERIMENTOS.
En el desarrollo de la clase, en las probabilidades se habla de
experimento. Se defini que evento como uno o ms resultados posibles
de hacer algo, y un experimento como la actividad que tendra como
resultado tales eventos.
85
Planeacin de experimentos. Si queremos resultados significativos,
es necesario un buen diseo de estos experimentos, basado en lo visto
anteriormente.
Anlisis de datos. Todo resultado debe estar sujeto a una hiptesis (en
el trascurso del siguiente curso) Prueba de Hiptesis.
86
completamente diferente. Lo que sigue como es posible lograr lo
anterior.
EXPERIMENTOS FACTORIALES.
Se plantea la fabricacin de dos bateras de carro, identificadas como A
y B, sometidas a tres pruebas. 1) Temperatura, 2) edad del motor, 3)
condiciones del cable de la batera. Podemos introducir el concepto de
experimentos factoriales usando esta notacin:
87
Con el ejercicio anterior y con cuatro factores, se requieren 16 pruebas,
para compartir todos los niveles con todos los factores. Si se requiere
comprobar las mismas dos bateras con 5 niveles de temperatura, 4
condiciones de motor y tres mediciones de condiciones de cable de
batera, se necesitan 2x5x4x3 = 120 pruebas para un experimento
factorial completo.
Usemos la notacin:
A = Ciudad 1 I = Empaque 1 1 = Pauta publicitaria 1
B = Ciudad 2 II = Empaque 2 2 = Pauta publicitaria 2
C = Ciudad 3 III = Empaque 3 3 = Pauta publicitaria 3
D = Ciudad 4 IV = Empaque 4 4 = Pauta Publicitaria 4
Pauta publicitaria
1 2 3 4
I C B D A
II B C A D
III D A B C
IV A D C B
Empaques Ciudades
89
Concepto de error estndar. En vez de decir la desviacin estndar
de la distribucin de las medias de la muestra para describir una
distribucin de medias de la muestra, los especialistas en estadstica se
refieren al error estndar de la media. Igual situacin la desviacin
estndar de la distribucin de proporciones se les denomina error
estndar de la proporcin. El termino error estndar se utiliza porque
da a entender un significado especifico. Un ejemplo ayudara a explicar
el porqu de su nombre. Deseamos conocer sobre la estatura de los
estudiantes universitarios. Podemos tomar una serie de muestras y
calcular la estatura media de cada muestra. Es improbable que las
medias de las muestras sean iguales, es de esperarse que se muestre
una variabilidad entre ellas. En estadstica eso se conoce como error
de muestreo debido al azar, debido nicamente a los elementos que
decidimos escoger para las muestras.
90
Se ha visto una serie de conceptos, y es necesario no solo
comprenderlos conceptualmente, sino aprenderlos a manejarlos de
manera operacional.
La distribucin de poblacin
Esta es la distribucin de las horas de operacin de todos los filtos.
Tiene:
u = la media de esta distribucin
= la desviacin estndar de esta distribucin
u
Si de alguna manera pudiramos tomar todas las muestras
Posibles de un tamao dado de esta distribucin de poblacin,
Dichas muestras estaran representadas grficamente por
Por estas cuatro muestras que vienen a continuacin. Auque
Solo hemos mostrado cuatro de tales muestras, en realidad
Habra un numero grande de ellas.
b)
91
Texto Texto Texto Texto Texto Texto
Ttulo
La distribucin de muestreo de la media:
Esta distribucin es la distribucin de todas las medias de muestra y
tiene:
92
La grafica c) es un ejemplo de este tipo. Basado en lo anterior los
especialistas han diseado frmulas que permiten estimar las
caractersticas de estas distribuciones tericas del muestreo, haciendo
innecesarias la recoleccin de grandes nmeros de muestras. Los
responsables de la toma de decisiones, solo requieren una muestra de
la poblacin, calculan la estadstica para esta muestra y de esta infieren
algo sobre los parmetros para toda la poblacin.
93
600
= = L 60 error estndar de la media
100
Luego utilizamos la tabla no. 1 de los valores de z y la ecuacin de
clculo de z y podremos calcular la probabilidad de que la media de la
muestra se encuentre entre L 1,900 y L 2,050.
1,900 2,000
z(1,900) = = = 1.67 desviacin estndar de la
60
media de una distribucin de probabilidad normal estndar.
2,0502,000
z(2,050) = = 0.83 desviacin estndar de la media de
60
una distribucin de probabilidad normal estndar.
94
Primero hay que calcular el error estndar de la media de la desviacin
estndar de la poblacin, as:
2,000
= = = L 365.16 error estndar de la media
30
Las areas serian 0.4798 y como la mitad del area es 0.5, podemos
calcular la probabilidad as:
o.5 0.4798 = 0.0202 es la probabilidad que el ingreso promedio sea
mayor a L 19,500.
Cuando n= 10
100
= 31.63 error estndar de la media
10
Y cuando n = 100
100
= = 10 error estndar de la media
100
20
= x
1
75 205
= x = 29.8 error estndar de la media de la poblacin finita.
5 201
Ejemplo:
Se recibe una oferta de una cadena de hoteles para operar en invierno,
garantizando una ganancia de L 45,000; por otro lado, ha estado
considerando la renta de equipo de fabricacin de nieve para la
temporada. Si renta el equipo, la estacin podra operar a tiempo
completo, sin importar la cantidad de nieve que caiga. Si decide usar
nieve fabricada para completar las nevadas naturales, su ganancia de
la temporada ser L 120,000, menos el costo de rentar y operar el
equipo de fabricacin de nieve. El costo de operacin ser de L 10,000
si cae ms de 40 pulgadas de nieve natural, L 50,000 si cae entre 20 y
40 pulgadas y L 90,000 si cae menos de 20 pulgadas
Distribucin de nevadas y ganancias
Cantidad de nieve Ganancias Probabilidad ocurrencia
Ms de 40 pulgadas 120,000 0.4
De 20 a 40 pulgadas 40,000 0.2
Menos de 20 pulgadas -40,000 0.4
96
0.4 >40 de nieve
L 120,000
L 40,000
Opere ella 0.2 20-40 de nieve
L 40,000
Sin fabricar nieve
58,000
0.4 <20 de nieve
L -40,000
L 98,000
L 58,000
L 18,000
El administrador tiene 3 alternativas:
a) Darla en arrendamiento y tendra una ganancia de L 45,000
b) Operar ella sin fabricacin de nieve, sus posibles resultados
estn dados en la tabla.
c) Operar ella con fabricacin de nieve.
En el caso de 20 a 40 pulgadas
(120,000 12,000 50,000) x 0.2 = L 11,600
97
Resumen:
Mas de 40 L 39,200
De 20 a 40 11,600
Menos de 20 7,200
Total ganancia esperada 58,000
ESTIMACIONES
Constantemente estamos haciendo estimaciones, quien ganara las elecciones,
podre cursar la asignatura, etc.
Tipos de estimaciones
En trminos generales, uno puede realizar dos tipos de estimaciones, la puntual y
la por intervalos.
Una estimacin por intervalos es rango de valores que se utiliza para estimar un
parmetro de la poblacin. Un ejemplo tpico, es cuando un estudiante dice que la
98
nota que estima obtener esta entre un 60 y 70%. Es muy probable que dentro de
eses rango este acertado.
Estimador y estimaciones
Cualquier estadstico de la muestra que se utilice para estimar un parmetro de la
poblacin se conoce como estimador, es decir un estimador es un estadstico de vla
muestra utilizado para estimar un parmetro poblacional. La media de la muestra
puede ser un estimador se la media de la poblacin , y la proporcin de la muestra
se pude utilizar como un estimador de la proporcin de la poblacin. Tambien es
posible aplicar el rango de la poblacin.
El siguiente ejemplo ilustra lo anterior.
Poblacin en que Parmetro de Estadstico de la Estimacin que
estamos poblacin que muestra que realizamos
interesados deseamos estimar utilizaremos como
estimador
Alumnos de la Promedio de los Promedio de 56% de
carrera de que aprueban alumnos que aprobacin por
administracin aprueban por ao.
periodo
Poblacin que Proporcin de Proporcin de la 64% de los
estudian en la U mujeres en la muestra de 500 estudiantes son
muestra mujeres
ESTIMACIONES PUNTUALES
99
La media de la muestra es el mejor estimador de la media de la poblacin. Es
insesgada, consistente, eficiente y siempre y cuando el tamao de la muestra sea
lo suficientemente grande, su distribucin muestral puede ser aproximada por medio
de la distribucin normal.
(
=
100
8.8 14.0 21.3 7.9 12.5 20.6 16.3 14.1 13.0
2 = 8.82 +14.02 +21.32 + 7.92 +12.52 +20.62 +16.32 +14.12 +13.02 = 2,003.65
x = (8.8+14+21.3+7.9+12.5+20.6+16.3+14.1+13 = 128.5
N=9
128.5
= x/n = = 14,278 personas
9
1 2,003.659(14.278)2
2 = ( 2 - n 2 ) = = 21,119 personas
1 8
1.5
= = = 0.071
200
101
Ahora podemos informar al jefe de la carrera que la permanencia de un estudiante
estar entre = 8 0.071 = LS = 8.071 aos y LI = 7.929 aos
Con un 68% de nivel de confianza sern 8 1(0.071) = LS= 8.071 y LI = 7.929 aos
Con un 95.5% de nivel de confianza ser 82(.071) = LS= 8.142 LI = 7.858 aos
Con un 99.7 de nivel de confianza ser 83(0.71) = LS = 8.213 y 7.787 aos
Ejemplo:
Un estudiante, est interesado en comprar un auto usado. Selecciona 125 anuncios
al azar, y establece que el precio promedio de esta muestra es de $ 3,250. El conoce
que la desviacin estndar de los precios es de $ 615.
a) Establezca una estimacin por intervalos para el precio promedio de un automvil
de manera que el estudiante tenga una seguridad del 68.3% de que la media de la
poblacin est dentro de este intervalo.
b) Establezca una estimacin de intervalo para el precio promedio de un auto de
modo que el estudiante tenga el 95.5% de certeza que la media de la poblacin est
dentro de este intervalo.
615
= 615 n= 125 = 3,250 = = = 55.01
125
a) = 3,250 55.01 = LS 3,194.99 y LI 3,305.01 A UNA DESVIACION
ESTANDAR
b) 2 = 3,250 2(55.01) = LS = 3,139.98 y LI 3,360.02
102
En estadstica, la probabilidad que asociamos con un una estimacin de intervalo
se conoce como nivel de confianza. Esta probabilidad indica que tanta confianza
tenemos de que la estimacin de intervalo incluya al parmetro poblacional. Una
probabilidad ms elevada implica mayor confianza porque el rango se ampla.
6
= = = 0.6 meses
100
103
Cuando no se conoce la desviacin estndar de la poblacin.
Una estimacin ms compleja, por no conocer la desviacin estndar de la
poblacin
Se nos pide estimar el ingreso medio anual de 700 familias que viven en
determinado lugar. Se extrae una muestra de 50 persona escogidas al azar.
N = 50 tamao de la muestra
= L 11,800
S = L 950 desviacin estndar de la muestra
Parte del problema es que desconocemos la desviacin estndar de la poblacin.
Es necesario partir de la desviacin estndar de la muestra para estimar la
desviacin estndar de la poblacin as:
( )2
= s =
1
950 70050
= X = X = L 129.57
1 50 7001
Como se pide un nivel de confianza de 90%, se busca en la tabla 90/2 = 0.45 y las
desviaciones estndar es 1.64 errores estndar
104
Como vimos la Binomial trabaja con datos discretos, no continuos y las frmulas
que utilizamos para encontrar la media y la desviacin estndar de la misma son:
= np
Donde:
N= nmero de ensayos o intentos
P= probabilidad de xito
Q= probabilidad de falla (1-p)
= p
Si hacemos una investigacin de que los alumnos vengan el viernes a recibir clases,
Tomando una pequea muestra aleatoria de 75 alumnos y encontramos que el 0.4
de ellos estn interesados en recibir clases los viernes. Los resultados son:
n = 75 Tamao de la muestra
= 0.4 Proporcin de los que vendran los viernes
= 0.6 Proporcin de los que no vendrn
105
Utilizando un intervalo de confianza de 99%, procedemos a encontrar el error
estndar de la proporcin as:
(0.4)(0.6)
= = = 0.057 error estndar estimado de la proporcin
75
Con un nivel de confianza de 99%, usando la tabla buscamos la probabilidad 99/2
es igual a 0.495 y localizamos este nmero en la tabla y podemos establecer que
representa 2.58 desviaciones estndar de la media.
Podemos decir que con un nivel de confianza de 99% creemos que la proporcin
de la poblacin estudiantil que desea clases el viernes esta entre 0.253 y 0.547.
Para estos casos existe la distribucin T, pero no solo se requiere que el tamao de
muestra sea 30 o menos, adems se requiere que la desviacin estndar se
desconozca. Adems de lo anterior debemos suponer que la poblacin es normal o
aproximadamente normal.
Grados de Libertad
Se afirma que existe una distribucin t diferente para cada tamao de la muestra,
es decir existe una distribucin t distinta para cada uno de los grados de libertad
Lo que estamos tratando de decir que los grados de libertad es el nmero de valores
que podemos escoger libremente.
Si consideramos que a+b, tiene una media de 18, tanto a y b pueden asumir
cualquier valor, siempre y cuando sumen 36/2 = 18
106
Si tenemos 7 elementos en la muestra y sabemos que la media de ellos es 16.
Supongamos que hacemos una estimacin con un nivel de confianza de 90%, para
buscar en la tabla seria 100-90 = 10% que es la probabilidad de error, denotado con
el smbolo.
La UNAH desea estimar los intervalos de consumo de energa y quiere estar con un
95% seguro que el consumo de energa media, se encuentra dentro de dicho
intervalo. Si utilizamos la distribucin t, porque el tamao de la muestra es menor
que 30, no se conoce la desviacin estndar de la poblacin y se considera que la
poblacin es aproximadamente normal. Los datos son:
= s = 700 KW
700
= = = 221.38 KW error estndar estimado de la media de una poblacin
10
infinita.
107
Buscando en la tabla 2 en la columna de 0.05 (100%-95%) y en el regln de 9 grados
de libertad encontramos que el valor t es 2.262.
Si recordamos
= podemos sustituir los valores conocidos
1,500
255 =
108
proporcin verdadera de la poblacin de 40,000 estudiantes a favor del nuevo
sistema de evaluacin, mas menos 0.02
Si z = 0.02
Y z = 1.64
1.64 = 0.02
Si p = 0.50 y q= 0.5
Podemos encontrar n
(0.5)(0.5)
N= 0.00014884 = 1,680 estudiantes Tamao de la muestra
(0.2)(0.8)
= 1075 alumnos
0.00014884
Cada vez que p sea menor o mayor de 0.5 el tamao de la muestra ser menor. Por
lo tanto usar 0.5 es donde se obtiene el tamao de muestra mayor.
109
RESUMEN DE FORMULAS
BINOMIAL
!
Probabilidad de r xitos en n intentos
!()!
Donde:
r = nmero de xitos deseados
n = nmero de intentos realizados
p = probabilidad de tener xito
q = probabilidad de fallar (1-p)
e = 2.71828
110
ENCONTRAR UNA PROBABILIDAD EN LA TABLA 1
z=
Donde:
Limite Superior = + z X
1
Lmite Inferior = - z X
1
Si la poblacin es finita
111
Limite Superior = + z X
1
Lmite Inferior = - z X
1
Si es infinita
Limite Superior = + z
Lmite Inferior = - z
Lmite Inferior = - t
Limite Superior = + z
Lmite Inferior = - z
112