Estad Soc
Estad Soc
Estad Soc
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
Fundamentación
En esta asignatura se pretende que el alumno desarrolle actividades que le permitan
conocer, interpretar y comprender en forma simple y razonada conceptos básicos de
probabilidad y estadística que estén aplicadas a las Ciencias Sociales.
Los conceptos que conciernen a la Estadística tienen que ver con un sector del Análisis
Matemático, que Ud. estudió en la anterior asignatura. La complejidad respecto a las
demostraciones de las fórmulas que se utilizan, como las deducciones correspondientes,
pertenecen al desarrollo teórico. Por lo tanto, trabajaremos con la aplicación y uso
correcto de estas fórmulas.
El nivel al que están enfocados los temas responde a la necesidad de servir como guía a
los alumnos que se inicien en esta disciplina. Se pretende facilitar la introducción a la
materia pero sin que deba considerarse que reemplaza a la consulta bibliográfica.
Objetivos generales
Comprender los conceptos de cada tema que se desarrolle en esta materia.
Visualizar las aplicaciones de los conceptos estadísticos y valorar la importancia
como herramienta importante en el área social.
Desarrollar capacidad de análisis y síntesis.
Proponer, interpretar y resolver situaciones problemáticas.
Demostrar capacidad para el razonamiento deductivo-inductivo, transfiriendo los
conocimientos adquiridos al análisis y diseño de sistemas.
Dominar la expresión gráfica, simbólica y conceptual relacionada con la
probabilidad.
INSTITUCIÓN CERVANTES 1
INSTITUCIÓN CERVANTES
Contenidos
Unidad I: Presentación de los datos
Estadística
Concepto general. El método estadístico: etapas. Recopilación de datos. Población e
individuo: definición. Atributos: clasificación. Variables discretas y continuas.
Muestras. Tablas y gráficos. Serie Simple. Amplitud de variable. Agrupamiento de
datos. Frecuencia: serie de frecuencia y serie de intervalos de clase. Gráficos: de barras,
de sectores. Histograma. Polígono de frecuencias.
Ejercicios. Aplicaciones.
Unidad V: Muestreo
Diseño de muestras.
Poblaciones finitas. Poblaciones infinitas.
Distribución de muestreo. Distintas clases de muestreo. Muestreo Aleatorio Simple.
Muestreo Sistemático. Muestreo Estratificado. Muestreo por Conglomerados.
Ejemplos.
2 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
Propuesta metodológica
Los recursos que se emplearán en el aula son el material bibliográfico citado y algún
otro que el docente o alumno quiera aportar; pizarra y marcadores. Por otro lado, se
mostrarán programas de computación relacionados a la materia que se encuentran
disponibles en el mercado.
Evaluación
Regularidad
Para regularizar la materia, el alumno debe tener APROBADO con un mínimo de 60%
las dos evaluaciónes parciales. También debe entregar en tiempo y forma las actividades
denominadas obligatorias y un trabajo práctico, para un mejor seguimiento. Estas se
encuentran detalladas en el cronograma de actividades que oportunamente se le entrega
al alumno.
Examen final
El alumno aprobará la materia con un mínimo del 60% del examen. Éste consistirá en
el planteo de situaciones problemáticas para su resolución y preguntas de índole teórico.
INSTITUCIÓN CERVANTES 3
INSTITUCIÓN CERVANTES
Bibliografía
KAZMIER, L. Y DIAZ MATA, A. –Estadistica Aplicada a la Administración y
Economía. Editorial Mc Graw Hill, Méjico, 1997.
SPIEGEL, M. –Estadística. Editorial Mc Graw Hill, España, 1991.
MEYER, P. –Probabilidad y Aplicaciones Estadísticas. Editorial Addison-Wesley
Iberoamericana, 1986.
TORANZOS, F. –Teoría Estadística y Aplicaciones. Editorial Kapeluz, 1982.
Módulo de la Cátedra.
Cualquier texto que responda a los contenidos que forman parte de esta asignatura.
4 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
Evaluación Diagnóstica
2
7 1 4
3− :
a) 6 : 4 + 2 3=
1− 1 1
+ 2
2 4
2 3
6 1
5 − − 22 .
10 2
b) −1 =
2
−1
5 −1
1
10
INSTITUCIÓN CERVANTES 5
INSTITUCIÓN CERVANTES
6 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
Unidad I
Presentación de los Datos
Objetivos
Comprender los casos en que se debe aplicar la teoría de muestras, su importancia y
beneficios.
Confeccionar las diferentes tablas y gráficos a partir de datos estadísticos.
Realizar los cálculos de los parámetros estadísticos en casos prácticos.
Interpretar gráficos y demás datos estadísticos correctamente.
Determinar las distribuciones de probabilidad para variables aleatorias continuas y
discretas.
INSTITUCIÓN CERVANTES 7
INSTITUCIÓN CERVANTES
Introducción
La observación es la clave de la comprensión. La observación, entonces, es de capital
importancia para desarrollar las habilidades de un pensamiento crítico y de análisis de
datos.
Cada día de nuestras vidas estamos expuestos a una amplia variedad de información
numérica relativa a fenómenos como la actividad del mercado de valores, los hallazgos de
estudios de mercado, los resultados de encuestas de opinión, las tasas de desempleo, los
pronósticos de éxito futuro de determinadas industrias, pronósticos del tiempo, datos
deportivos, etc. El tema de la estadística abarca la recolección, presentación, y
caracterización de la información para ayudar tanto en el análisis de datos, como en el
proceso de la toma de decisiones.
Contabilidad:
Para seleccionar muestras con propósito de auditoria.
Finanzas:
Para estar al tanto de medidas financieras en el transcurso del tiempo y desarrollar
formas de pronosticar valores de estas medidas en momentos futuros.
Administración:
Para describir características de empleados dentro de una empresa.
Para controlar y/o mejorar la calidad de los productos fabricados.
Marketing:
Para estimar la proporción de clientes que prefieren un producto sobre otros, y las
razones de esta preferencia.
Para sacar conclusiones acerca de las estrategias de publicidad más convenientes
para la introducción de un nuevo producto al mercado.
8 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
Estadística descriptiva
Puede definirse, como el conjunto de métodos que incluyen la recolección,
presentación, caracterización y análisis de un conjunto determinado de datos, con el fin de
describir apropiadamente las diversas características de los mismos.
Los métodos de la estadística descriptiva son importantes y han sido la base de los
métodos de la estadística inferencial. Han servido para mejorar la teoría de la
probabilidad, que, actualmente, ha hecho posible la implementación de la estadística en
todos los campos de la investigación.
Estadística inferencial
La estadística inferencial puede definirse como el conjunto de métodos que hacen
posible la estimación de una característica determinada de la población o la toma de
decisiones referentes a la población, basándose solo en los resultados de la muestra extraída en
la misma.
El uso de la estadística inferencial se debe al hecho de que a medida que una población
crece, por lo general resulta demasiado costoso, lento e incómodo, obtener la información
deseada de toda la población.
Los atributos con respecto a los cuales se hace el relevamiento de los datos, se clasifican
en dos tipos: cualitativos y cuantitativos.
INSTITUCIÓN CERVANTES 9
INSTITUCIÓN CERVANTES
Los atributos de tipo cuantitativo están expresados por cantidades numéricas que
pueden ser de tipo discretas o continuas.
Las cantidades discretas están expresadas por números enteros (...-2; -1; 0; 1;2; 3...),
mientras que las continuas lo están por números reales (...-2; -1,5;-1,3;-1; -0,9; -0,6; -0,2;
0; 1; 1,5; 1,7; 2; 2,3; 2,9;; 3,5...), lo que significa que entre los valores de dos mediciones
existen siempre infinitos valores intermedios. Por ejemplo: peso, talla, tiempo, longitud,
área, volumen, precio, etc.).
10 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
1) Serie Simple: ésta consiste en confeccionar una tabla, donde ubicaremos todos los
datos recogidos, inclusive los que están repetidos, escribiéndolos tantas veces como se
repitan, en orden ascendente, es decir, de menor a mayor.
2) Serie de Frecuencia: consiste en realizar una tabla de tres columnas, escribiendo en
la primera columna cada dato una sola vez, en la segunda columna de la tabla se
coloca la cantidad de veces que se repite cada dato, esta cantidad recibe el nombre de
frecuencia absoluta (f) de ese dato y en la tercera columna se coloca la frecuencia
relativa (fr)de cada dato, la cual se obtiene dividiendo la frecuencia absoluta de cada
dato por la cantidad total de datos. Es decir, la frecuencia relativa nos indica la
representatividad de cada dato en el conjunto total.
3) Serie de Intervalos de clase: consiste en realizar una tabla de tres columnas,
escribiendo en la primera, los distintos intervalos seleccionados, de acuerdo al tipo de
información que se desea obtener. En la segunda columna colocamos la cantidad de
datos que hay en cada intervalo y en la tercera, la frecuencia relativa de cada
intervalo, que al igual que para la serie de frecuencia, ésta se obtiene del cociente
entre la frecuencia absoluta de cada intervalo y la cantidad total de datos.
Luego estudiaremos cada una de estas series detenidamente, aclarando todos los
detalles de las mismas.
Para presentar en forma más concreta estas series, desarrollamos un ejemplo simple:
Primero dijimos que, una vez decidido el tema de estudio (promedio general de las
notas de los alumnos de un determinado curso en un colegio secundario), sobre una
determinada población (todos los alumnos del curso elegido), se obtienen los datos
necesarios, en este caso, esto se puede realizar fijándonos en las libretas de cada alumno y
escribiendo sus promedios generales en el orden que vamos leyendo.
Si intentamos tener una idea del promedio general del curso, será mucho más fácil si
realizamos la serie simple de los mismos.
NO X
1 2
2 3,8
INSTITUCIÓN CERVANTES 11
INSTITUCIÓN CERVANTES
NO X
3 5,6
4 6,3
5 7,4
6 7,4
7 8,7
8 9,5
9 10
10 10
Como se observa, de esta forma es mucho más fácil y rápido ver, por ejemplo, entre que
valores varían los promedios de los alumnos, que en el caso de tenerlos desordenados, no
es tan sencillo.
X f fr = f/N (fr*100)%
2 1 0.10 10%
3,8 1 0.10 10%
5,6 1 0.10 10%
6,3 1 0.10 10%
7,4 2 0.20 20%
8,7 1 0.10 10%
9,5 1 0.10 10%
10 2 0.20 20%
TOTALES N=10 1.00 100%
De acuerdo a las categorías que nos interesa estudiar, definimos los intervalos.
Las distribuciones en intervalos de clase presentan los datos de una manera mas
práctica, pero tiene el inconveniente de la pérdida de exactitud en cuanto a los datos en sí
y respecto de los parámetros o estadísticos a calcular, es decir, que la agrupación de los
datos nos favorece en la practicidad del manejo de los mismos, pero mientras más
agrupamos, vamos perdiendo precisión en los resultados.
X f fr = f / N (fr*100)%
[0-3) 1 0.10 10%
[3-6) 2 0.20 20%
12 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
X f fr = f / N (fr*100)%
[6-9) 4 0.50 50%
[9-12) 3 0.20 20%
N=10 1.00 100%
Las frecuencias que figuran en la segunda columna indican la cantidad de datos que
están comprendidos en cada intervalo. Son las frecuencias de un intervalo de clase (f).
Las siguientes son características a tener en cuenta, como autocontrol, para saber si la
serie que hemos construido está bien o no.
Siempre la suma de las frecuencias absolutas debe coincidir con el total de datos.
Siempre la suma de las frecuencias relativas debe ser 1 lo que equivale al 100%, si
consideramos porcentajes.
Bueno, espero que hayan entendido, por lo menos hasta aquí, todos los conceptos
desarrollados. Quizás ustedes me estén diciendo que sí (eso espero), pero como yo no
puedo verlos no nos queda otro remedio que comprobarlo a través de la realización de los
ejercicios 1-2-3-4-y 5 de la Unidad I del cuadernillo de ejercicios. Estudien y practiquen
con los ejercicios, así no se les acumulan todos los temas para el final.
Gráficos
Otra forma de presentar los datos es a través de gráficos.
Los gráficos permiten interpretar y visualizar el fenómeno que se estudia en forma más
clara. A través de ellos se logra una comprensión más rápida del significado de los datos
obtenidos y de la relación de dependencia que pueda existir entre ellos.
Hay distintos tipos de gráficos, según con qué serie estemos trabajando. Entre los más
conocidos podemos nombrar los gráficos de barras, los gráficos de sectores, los
histogramas y los polígonos de frecuencia. Los que describiremos a continuación.
De acuerdo con la serie que se esté trabajando, será el gráfico que corresponde realizar.
Para el caso de la serie simple el gráfico es muy sencillo. Veamos nuevamente la tabla y
recordemos que todos los datos están escritos, aún los que están repetidos, se escriben
tantas veces como aparezcan, por lo tanto la frecuencia de cada dato, en la serie simple es
siempre 1.
INSTITUCIÓN CERVANTES 13
INSTITUCIÓN CERVANTES
Buscando cuidadosamente en nuestra memoria quizás nos acordemos que alguna vez
sentimos hablar de sistema de coordenadas cartesianas. Usando esta herramienta,
representaremos los datos presentados en la serie simple.
0 1 2 3 4 5 6 7 8 9 10 X
Por lo tanto, debido a las características de esta serie, obtenemos un gráfico, donde todas
las frecuencias tienen la misma altura (1).
0 1 2 3 4 5 6 7 8 9 10 X
Pueden ser líneas simples o múltiples según se trate de representar uno o más atributos
(características) de los datos. Cuando se trata de líneas múltiples, se presentan agrupadas
y los grupos deben aparecer separados.
Las líneas pueden ser horizontales o verticales. Pueden presentarse diferentes gráficos
de líneas para una misma serie de datos.
14 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
Pues, porque si usáramos barras, estaríamos abarcando más de un valor por vez. Y lo
que nosotros representamos en el gráfico es la frecuencia de cada valor por separado, y no
de un conjunto de valores, como haremos luego en la serie de intervalos.
Ejemplo 1
Un determinado país posee el siguiente cuadro de población:
TRABAJO POBLACION
Agricultura y Pesca 400 000
Industria 2 000 000
Servicios 1 800 000
Comercio y Banca 1 300 000
Construcción 600 000
Minas 200 000
En este caso, usamos para realizar el gráfico barras de un ancho determinado, pero fijo,
en vez de líneas, es decir, los rectángulos que quedan formados deben tener siempre
igual base, pues de lo contrario no sería posible una buena comparación, ya que estarían
cambiando varias cosas a la misma vez.
2500000
2000000
1500000
1000000
500000
0
Ag. Y Pes. Ind. Serv. Com. Cons. Minas.
INSTITUCIÓN CERVANTES 15
INSTITUCIÓN CERVANTES
Ejemplo 2
¿Existe corrupción en los medios de comunicación?
70
60
50
40
30
20
10
0
SI NO NS/NC
Gráficos de sectores
La representación en sectores resulta útil cuando se desea comparar datos que están
expresados en porcentaje.
Mediante el gráfico de sectores se representa la proporción, dentro del conjunto total, de los
distintos datos o caracteres.
12%
SI
23%
NO
NS/NC
65%
16 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
0
0 3 6 9 12
Para construir el polígono de frecuencias se unen los puntos medios de las bases
superiores de cada rectángulo. Para cerrar el polígono se agregan dos intervalos: uno
anterior al primero y otro posterior al último del mismo ancho de los ya dibujados y se
prolonga el polígono hasta los puntos medios de estos intervalos.
0
0 3 6 9 12
INSTITUCIÓN CERVANTES 17
INSTITUCIÓN CERVANTES
El área total de los rectángulos es igual al área limitada por el polígono y el eje
horizontal, que representa la totalidad de los datos.
Bueno, como podrán darse cuenta no se van a salvar de hacer los ejercicios. Así
8 que ahora comiencen ('y terminen') a realizar los ejercicios 6 y 7 de la Unidad I.
18 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
Unidad II
Análisis y medición de datos
Objetivos
Comprender la necesidad de síntesis, su importancia y beneficios.
Realizar los cálculos de los parámetros estadísticos en casos prácticos.
Interpretar las medidas resúmenes correctamente.
INSTITUCIÓN CERVANTES 19
INSTITUCIÓN CERVANTES
Promedio o Media
Mediana
Modo o moda
Estos parámetros son valores que caracterizan a los datos de la población en estudio.
Pero para tener una idea más completa y precisa de cómo están distribuidos los datos,
además de los valores centrales es necesario conocer si los datos están alejados o no con
respecto a esos valores centrales. Esto es, una vez calculado el valor central (promedio),
graficar éste conjuntamente con los datos y ver si realmente es o no representativo de los
mismos. O sea, si los datos están bien concentrados (cercanos) alrededor de este valor, o
muy alejados (no concentrados) del mismo.
Como el valor central más usado es el promedio, los desvíos se miden con respecto a él.
Es decir, una vez calculado el promedio de un determinado conjunto de datos, medimos
el alejamiento de cada dato con respecto al promedio (desvíos).
Por lo tanto, con esto vemos la necesidad de estudiar también los parámetros de
dispersión.
Estos son:
Desvíos
Desviación media
Varianza
Desviación estándar
20 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
Promedio
El promedio de una población, en una serie simple, se calcula realizando el cociente
entre la suma de todos los datos (x) y la cantidad total que hay de los mismos, es decir N
o n, según estemos considerando una población o una muestra respectivamente.
En símbolos:
µ= ∑x x=
∑x
N n
∑x
x=
n
Siguiendo con el ejemplo desarrollado en la unidad I, y fijándonos en el cuadro
realizado para la serie simple, sumamos la columna de los datos (x) y obtenemos 70,7.
En este ejemplo, no se está considerando ninguna muestra de la población, por lo tanto
obtenemos el promedio de la población total, es decir, del curso completo.
µ=∑ =
x 70.7
= 7.07
N 10
Mediana
La mediana de una serie simple es el valor del dato que divide al conjunto total en dos
partes iguales.
X
2
3,8
5,6
6,3
7,4
7,4
8,7
9,5
10
10
Si la serie tuviera una cantidad impar de datos la mediana coincidiría con un valor de
los datos el central, es decir, si tuviéramos en vez de 10 notas, 11 notas.
X
1
2
3,8
5,6
6,3
7
7,4
8,7
9,5
10
10
El valor de la mediana, en este caso correspondería al valor x=7, pues es el valor que
divide al conjunto total de 11 datos en dos conjuntos con 5 datos cada uno, es decir,
Me=7
22 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
Modo
El Modo es el valor del dato que tiene mayor frecuencia, es decir el dato que se repite
mayor cantidad de veces.
En una serie simple, no se puede calcular el modo, pues todos los datos tienen
frecuencia 1, por lo tanto ningún dato tiene frecuencia máxima.
Desvíos
Se llama desvío
d = x−x
de un dato, con respecto al promedio del conjunto total de datos a la diferencia entre el
valor del dato y el promedio del conjunto total de datos. Por desgracia, los desvíos tienen
algunos signos positivos y otros, negativos, y su suma siempre será cero. Por lo tanto no
se puede realizar un promedio de los desvíos, pues este siempre dará cero. Para salvar
este inconveniente consideramos el valor absoluto de cada desvío, es decir, el valor del
desvío, pero siempre positivo.
d = x−x
5; 8; 5; 9; 6.
En la primera columna de esta tabla se tienen los datos (x), ordenados de menor a
mayor.
En la tercera columna calculamos los desvíos de los datos con respecto al promedio, es
decir, realizamos d = x − x para cada dato.
En la cuarta columna calculamos el valor absoluto de los desvíos de los datos con
respecto al promedio,
d = x−x
En la quinta columna calculamos los cuadrados de los desvíos de los datos con
respecto al promedio,
d = (x − x )
2
que nos será útil para el cálculo de otro parámetro de dispersión, que estudiaremos
luego.
2
x x x−x x−x x−x
5 6,6 -1,6 1,6 2,56
5 6,6 -1,6 1,6 2,56
6 6,6 -0,6 0,6 0,36
8 6,6 +1,4 1,4 1,96
9 6,6 +2,4 2,4 5,76
33 0,00 7,6 13,20
µ = ∑ = = 6.6
x 33
N 5
O sea que para saber qué hemos realizado en cada columna, basta con leer el título de
la columna.
24 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
Desviación media
La desviación media es el promedio de los valores absolutos de los desvíos.
En símbolos:
∑ x−x
dm =
N
Para el cálculo de la desviación media en el ejemplo anterior, se deben sumar todos los
números de la tercera columna y dividir esa suma por la cantidad total de datos, es decir,
7 ,6
dm = = 1 , 52
5
La desviación media es útil para comparar la dispersión de los datos, ya que en general
puede afirmarse que a mayor desviación media, mayor dispersión hay de los datos con
respecto al promedio, y a menor desviación media, hay menor dispersión de los datos con
respecto al promedio.
Por las dudas no esté muy clara esta interpretación de la desviación media, lo vamos a
explicar de otra forma: mientras más grande es la desviación media más 'desparramados'
(dispersos) están los datos con respecto al promedio. Y mientras más pequeño sea el
valor de la desviación media, más amontonados (concentrados) se encuentran los datos
en torno al promedio, y por lo tanto, este último será un buen representante de los datos.
Es decir, la desviación media nos da una idea de si los datos que tenemos están muy
lejos o no del promedio del conjunto de datos, que es el valor representativo del mismo.
Esta medida, rara vez se usa.
Otros parámetros de dispersión, usados también para medir el alejamiento de los datos
con respecto al promedio de los mismos, ya sea en un sentido o en otro, son la Varianza y
la Desviación estándar.
Varianza
Otra alternativa es trabajar con el cuadrado de los desvíos, ya que esto eliminará
también el efecto de los signos. Para evitar los valores negativos de los desvíos suelen
tomarse los cuadrados de los mismos.
INSTITUCIÓN CERVANTES 25
INSTITUCIÓN CERVANTES
∑(x − µ)
2
σ2 =
N
S 2
=
¦ (x − x) 2
n −1
Esto significa que para su cálculo debemos hacer la suma de todos los números que se
encuentran en la quinta columna y dividir esa suma por la cantidad total de datos.
Es decir,
13,2
S2 = = 2.64
5
Desviación estándar
Se llama desviación estándar a la raíz cuadrada de la varianza.
Al promediar las desviaciones cuadráticas de los datos con respecto al promedio de los
mismos, y sacar la raíz cuadrada del resultado, compensamos el hecho de que las
desviaciones se elevaron al cuadrado.
26 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
En el ejemplo anterior:
σ = 2.64 = 1,62
Ahora, ¿cómo podemos hacer para saber si ese valor calculado como promedio, es
8 o no un buen representante de los datos?
Ya dijimos que la desviación estándar nos da una idea de cuán alejados o próximos se
encuentran los datos con respecto al promedio. De aquí se desprende que si el valor de la
desviación estándar es pequeño, los valores de los datos están próximos o concentrados
alrededor del promedio de la serie y como consecuencia el promedio es un buen
representante de los datos. En caso contrario, es decir si el valor de la desviación estándar
es grande, esto implica que los valores de los datos están alejados o no concentrados
alrededor del promedio de la serie y como consecuencia el promedio no es un buen
representante de los datos.
INSTITUCIÓN CERVANTES 27
INSTITUCIÓN CERVANTES
Promedio
El promedio, en una serie de frecuencias, se calcula realizando el cociente de la suma de
los productos de cada dato y su respectiva frecuencia por la cantidad total de datos, es
decir N o n, según se este considerando una población o una muestra respectivamente.
Para el cálculo del promedio en este tipo de serie, realizamos la siguiente tabla:
Volvemos al ejemplo para el cual desarrollamos la serie de frecuencia en la primera
unidad, agregando a aquella tabla 3 columnas.
Es decir, sumamos todos los valores obtenidos en la tercera columna (70,7) en donde
estamos considerando la cantidad de veces que figura cada dato, para que así cada uno de
éstos tenga la importancia que le corresponde dentro del conjunto total de datos, y
dividimos este valor por 10, que en este ejemplo es la totalidad de datos. La séptima
columna, denominada frecuencia acumulada (fa) se calcula de la siguiente manera, la
primera frecuencia acumulada es igual a la primera frecuencia absoluta, en este caso
fa=1. Para obtener la segunda frecuencia acumulada, se le suma a la primera (fa=1), la
segunda frecuencia absoluta f=1, y obtenemos fa=2. Para obtener la tercer frecuencia
acumulada, se le suma a la segunda (fa=2), la tercera frecuencia absoluta f=1, y
obtenemos fa=3 y así seguimos hasta sumar o acumular la ultima frecuencia absoluta.
28 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
Un detalle muy importante, que también nos sirve a modo de control, para saber si lo
que estamos haciendo está bien o no, es que la última frecuencia acumulada, debe ser
igual a la cantidad total de datos, pues ya los acumula a todos.
¿Está claro?
En caso de obtener una respuesta negativa, será necesario volver a leer toda la
explicación de modo más concentrado que la vez anterior. Y en caso de seguir siendo
negativa la respuesta a esta última pregunta, no dude en acudir sin falta y puntualmente
a su próximo horario de tutoría.
Mediana
Para ello se consideran las frecuencias acumuladas (fa).
Es decir, la mediana de la serie es el valor del dato, para el cual su fa, satisface el menor
número que cumple la condición
n +1
fa ≥
2
Modo
El modo de un conjunto de datos, es el valor del dato que posee mayor frecuencia o -
en 'forma más casera' - el dato que más se repite.
Cuando en el conjunto de datos hay un sólo modo, se dice que los datos poseen una
distribución unimodal. Si hay dos datos con la misma frecuencia máxima, la distribución
es bimodal. En caso de haber mayor cantidad de datos con la misma frecuencia máxima,
diremos que los datos poseen una distribución polimodal.
Siguiendo con la misma serie de frecuencia, observamos que la frecuencia máxima que
encontramos en la segunda columna de la tabla es f=2 y además ésta se repite dos veces,
es decir para los valores de los datos x=7,4 y para x=10, por lo tanto la distribución de
estos datos es bimodal y sus modos son:
Mo=7,4 y Mo=10
INSTITUCIÓN CERVANTES 29
INSTITUCIÓN CERVANTES
Para hacer más sencillo el cálculo de los mismos, seguiremos desarrollando el mismo
ejemplo que veníamos utilizando.
Desviación Media
La desviación media está definida por la fórmula
dm =
∑ (x − x) f
N
30 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
Es decir, la suma de los valores que se encuentran en la sexta columna, dividido por la
cantidad de datos.
En este caso
dm =
∑ (x − x) f =
21.16
= 2.116
N 10
Varianza
La varianza está definida como el promedio de los desvíos cuadráticos, multiplicados
por las correspondientes frecuencias, para considerar los datos todas las veces que éstos
figuran. En otras palabras la varianza está dada por
S 2
=
∑ (x − x) 2
f
N
Es decir, la suma de los valores que se encuentran en la octava columna, dividido por la
cantidad de datos.
Que en nuestro ejemplo estaría dada por
S2 =
∑ (x − x) 2
f
=
65.09
= 6.509
N 10
Desviación estándar
Al igual que en la serie simple, la desviación estándar está dada por
S=
∑ (x − x) 2
f
= 6.509 = 2.55
N
Con este análisis vemos que teniendo los valores del promedio y de la desviación
estándar podemos obtener una buena caracterización del conjunto de datos que
poseemos.
INSTITUCIÓN CERVANTES 31
INSTITUCIÓN CERVANTES
Promedio
Para hallar el promedio en este tipo de series, se calcula primero el punto medio de
cada intervalo. En la tercera columna de la tabla realizada más abajo figuran los valores
medios de cada intervalo,
xm
en la cuarta, los productos de las frecuencias de cada intervalo por su punto medio
xm ∗ f
Los valores medios o representantes de los intervalos se calculan sumando los extremos
del intervalo correspondiente y dividiendo esta suma por dos.
2 2
µ=∑
( xm ∗ f )
Para la población completa
N
X=
∑ (x m ∗f)
para muestras.
n
72
µ= = 7.2
10
32 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
Como podemos apreciar, el valor del promedio no coincide con los valores de los
promedios para las series anteriores. Esto se debe a que al agrupar los datos en
intervalos, se pierde la exactitud de las mediciones observadas.
Mediana
Si consideramos las frecuencias acumuladas correspondientes a los intervalos,
tendremos
n +1
= 5,5
2
La mediana está contenida en el intervalo que corresponde a fa=6; por lo tanto el valor
de la mediana es el representante del intervalo [6, 8). Es decir,
Me=7
Mo=7
Desviación media
dm =
∑ (x − x) f =
22.4
= 2.24
N 10
Es decir, es la suma de todos los valores de la sexta columna, dividida por la cantidad de
observaciones.
INSTITUCIÓN CERVANTES 33
INSTITUCIÓN CERVANTES
Varianza
S 2
=
(x − x) 2
f
=
75.6
= 7.56
N 10
Desviación estándar
Como ya lo dijimos anteriormente la desviación estándar es la raíz cuadrada de la
varianza.
S=
∑ (x − x) 2
f
= 7.56 = 2.75
N
Me = x = M
Cuando los parámetros de posición no coinciden, las curvas son asimétricas. Esta
asimetría puede ser a derecha o a izquierda, depende de la ubicación del modo, que es el
valor que mayor frecuencia tiene, y por ello de ahí en más, ya sea para la izquierda o para
la derecha, la curva es descendente.
34 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
Como hemos dicho: una distribución normal está representada por la curva o campana de
Gauss. Una distribución de este tipo queda determinada por la media aritmética y la
desviación estándar.
En una distribución normal, se cumple la siguiente relación: si a partir del punto que
corresponde al valor del promedio se llevan hacia ambos lados, o, 2 o, 3 o,quedan
determinados los siguientes intervalos:
INSTITUCIÓN CERVANTES 35
INSTITUCIÓN CERVANTES
A esta altura del desarrollo de esta unidad, es conveniente empezar a practicar los
8 temas desarrollados, con algunos ejercicios. Para ello realizaremos los ejercicios 1-
2 y 3 de la Unidad II del Cuadernillo de ejercicios.
Si la desviación estándar es muy pequeña, significa que los valores de los datos se
concentran alrededor del valor del promedio. Si la desviación estándar es muy grande,
los valores de los datos están muy dispersos con respecto al promedio de los mismos. Por
lo tanto las curvas representantes de estas situaciones serían las siguientes:
x x
En la curva 1 se muestra una variable con pequeña desviación estándar, los valores
están concentrados en torno del valor medio. En la curva 2, la desviación estándar es
muy grande; hay gran dispersión. Ambas distribuciones normales comparten el valor del
promedio, pero la dispersión es muy distinta.
36 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
Pues no, porque estamos comparando dos cosas distintas entre sí. Miremos esto de otra
forma. Supongamos que todos los alumnos de la clase promediaron 53 puntos en
vocabulario con una desviación estándar S=12 y 75 puntos en gramática con una S=16.
Así podemos sostener que el promedio de este estudiante en la parte de vocabulario es de
(68-53)/12=15/12=1.25 sobre el promedio de la clase, en tanto que su rendimiento en la
parte de gramática es de solo (85-75)/16=10/16=0.625 sobre el promedio de la clase.
Esto sí tiene sentido, pues estamos comparando una nota particular con el promedio
general de lo mismo. Como resultado de esta comparación observamos que la nota de
este alumno en vocabulario está más alejada del promedio que la clase tiene en
vocabulario que lo que está alejada su nota de gramática con respecto al promedio
general del curso en gramática. Por lo tanto, este alumno se destaca más con respecto a
su curso en vocabulario que en gramática, pues su nota está más alejada positivamente
del promedio que el curso tiene en vocabulario.
x−x x−µ
Ζ= o Ζ=
S σ
Dependiendo que los datos constituyan una muestra o una población.
En estas unidades, z nos indica cuántas desviaciones estándar un valor está por
encima o por debajo del promedio del conjunto de datos al que pertenece.
INSTITUCIÓN CERVANTES 37
INSTITUCIÓN CERVANTES
Coeficiente de variación
Una desventaja de la desviación estándar como una medida de variación es que
depende de las unidades de medida. Un valor de desviación estándar puede ser grande o
pequeño según lo que estemos midiendo. Teniendo en cuenta esto tomaremos una
medida de variación relativa, es decir una proporción de la variación con respecto al
promedio del mismo conjunto de datos al que pertenece la desviación.
S σ
V= = 100% O V = = 100 %
x µ
Ahora están ya en condiciones de realizar todos los ejercicios restantes de la Unidad II.
No dejes de hacerlos, practicar mucho y concurrir a consultar tus dudas. No las dejes
acumular!!!!
Una vez aprendidos y estudiados los conceptos expuestos en las Unidades I y II y luego
de realizar los ejercicios correspondientes a estas unidades está en condiciones de realizar
el siguiente trabajo práctico con el programa estadístico INFOSTAT.
38 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
A este programa lo utilizaremos en todos los trabajos prácticos que se realizarán en esta
materia.
La base de datos que se les entregará consta de distintas variables, entre las que
encontramos variables cualitativas y cuantitativas, y para cada una de ellas tenemos los
datos de n = 100 empleados.
Ejemplo
1. Activamos el menú ¨ESTADISTICAS¨.
2. Una vez en este menú, elegimos la opción ¨MEDIDAS RESUMEN¨ y dentro de él,
elegimos la variable que se va a estudiar (en este caso la variable SUELDO) y
aceptamos.
INSTITUCIÓN CERVANTES 39
INSTITUCIÓN CERVANTES
40 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
4. Una vez que estamos en este cuadro de diálogo, elegimos las medidas que nos
interesa calcular y aceptamos. Obteniendo de esta manera el siguiente cuadro de
diálogo.
Atención
Algo muy importante y que no se debe olvidar de realizar, bajo ningún aspecto, es
una correcta interpretación de los resultados.
Mostraremos cómo hacerlo con esta variable para que le sirva como guía para el resto
de las variables.
INSTITUCIÓN CERVANTES 41
INSTITUCIÓN CERVANTES
Significa que en promedio los 100 empleados ganan $1524 con un error aproximado de
$1536. Es decir que en realidad ganan entre $0,00 y $3060.
Con esto podemos concluir que en este caso el promedio no es un buen representante
de los datos, al tener una desviación estándar tan grande. Es decir, los datos están muy
dispersos con respecto al promedio. Y esto es real pues, existen empleados con $406
(valor mínimo) de sueldo y otros con $8173 de sueldo (valor máximo).
Atención
También debe realizar los gráficos correspondientes a cada variable.
En este caso, al ser la variable SUELDO una variable continua, corresponde realizar el
histograma. Para ello seguimos los siguientes pasos:
42 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
INSTITUCIÓN CERVANTES 43
INSTITUCIÓN CERVANTES
Ahora realice Ud. el mismo trabajo con el resto de las variables. Para ello guíese
8 con las pautas establecidas en el Trabajo Práctico nº 1 presentado en el
Cuadernillo de Actividades y con el ejemplo anterior.
44 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
Unidad III
Probabilidades
Objetivos
Comprender el concepto de probabilidad y sus propiedades.
Identificar, plantear y resolver correctamente situaciones problemáticas.
INSTITUCIÓN CERVANTES 45
INSTITUCIÓN CERVANTES
Probabilidades
Ya todos estamos familiarizados con el concepto de probabilidad. A menudo usamos
este término para referirnos a la posibilidad de que un suceso ocurra o no. Además, si se
plantea el caso en que hay que calcular la probabilidad de que salga “Número” en un
tiro de una moneda, todos podremos decir que esta probabilidad es de ‘LA MITAD’. A
estos conocimientos intuitivos, les daremos forma Matemática en esta unidad. Para ello
comenzaremos con algunos conceptos.
Debemos distinguir los sucesos determinísticos (donde existe una ley matemática que
rige su comportamiento); de los aleatorios (donde no es posible predecir con exactitud su
comportamiento).
De todas las situaciones posibles, tomaremos sólo los casos aleatorios igualmente
posibles o equiposibles, es decir, aquellas situaciones en que no se manifiesta preferencia
de un caso sobre otro.
Introducción al concepto de
probabilidad
Denotaremos con el nombre E al conjunto ESPACIO con el que trabajaremos. Este
conjunto: ESPACIO está formado por todas las posibilidades, es decir, todos los posibles
resultados correspondientes al acontecimiento con que estamos tratando. En término de
conjuntos equivale a nuestro Conjunto Universal o Referencial.
46 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
El espacio nos queda dividido en las fichas que tienen forma de rombo y aquellas que
no la tienen.
#A 2 1
p( A) = = =
# E 12 6
B=∅ #B=0
La probabilidad de extraer una ficha cuadrada es:
#B 0
p( B ) = = =0 p (B) = 0
# E 12
C=E # C = # E = 12 = n
n # E 12
p (C ) = p ( E ) = = = =1 p(E) = 1
n # E 12
INSTITUCIÓN CERVANTES 47
INSTITUCIÓN CERVANTES
Propiedad 1
0 ≤ p(X) ≤ 1
c = # X
c
p( X ) = siendo n = # E
n c ≤ n
Propiedad 2
Si todos los elementos de E cumplen con la propiedad X, tendremos:
#X=#E=c=n
Entonces:
n
p( X ) = p( E ) = =1 p(E) = 1 expresa la CERTEZA
n
Propiedad 3
Si ningún elemento de E cumple con la propiedad X, tendremos:
X=∅ #X=0
0
p ( X ) = p ( ∅) = =0 p(∅) = 0 expresa la IMPOSIBILIDAD
12
Propiedad 4
#A 2 1
#A=c=2 p( A) = = =
#E 12 6
# E = n = 12
48 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
# N = # E - # A = n - c = 12 - 2 = 10
n − c 10 5 p ( A) + p ( A ) = 1
p( N ) = = =
n 12 6
c n−c n
p( M ) + p( N ) = + = =1
n n n
La suma de las probabilidades de que un suceso ocurra o no es 1
Para recordar
/ NUNCA una probabilidad puede ser superior a 1
Actividades
1. ¿Cuál es la probabilidad de sacar un 2 en la cara superior de un dado que se arroja
sobre una mesa?
4. En una urna hay 6 bolitas rojas, 7 negras, 4 azules y 2 amarillas. Si se extrae una al
azar ¿Cuál es la probabilidad de obtener una roja?
5. Una persona compra 2 números de una rifa de 4 cifras. ¿Qué probabilidad hay de
que obtenga el primer premio?
Probabilidad de 2 sucesos
Para comprender este tema debemos tener muy en claro las operaciones entre
conjuntos, por lo que le recomiendo que repase este tema.
Ejemplo:
INSTITUCIÓN CERVANTES 49
INSTITUCIÓN CERVANTES
# E = 10 #A=4 #B=3
#A 4 2 #B 3
p( A) = = = p( B) = =
# E 10 5 # E 10
2 1 2 = # ( A ∩ B )
p(A ∩ B) = p(A y B) = p( " Ne gra" y"2") = = siendo
10 5 10 = # E
#(A B)
p ( AyB ) =
# E
c) ¿Cuál es la probabilidad de extraer una ficha que sea negra o con el número “2”?
50 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
5 5 =# (A ∪ B)
p(A o B) = p(" Negra"o "2") = siendo
10 10 =# E
# ( A B)
p( AoB) =
#E
# ( A ∪ B ) = # A+ # B −# ( A ∩ B )
# (A ∪ B)
p( A ∪ B ) =
#E
# A+ # B −# ( A ∩ B )
=
#E
# A # B # (A ∩ B)
= + −
#E #E #E
= p( A) + p(B ) − p( AyB )
Al igual que en las operaciones con Conjuntos, se presentan algunos casos particulares
que reciben nombres específicos.
Casos particulares
I- Sucesos Excluyentes
Dos sucesos son EXCLUYENTES O INCOMPATIBLES cuando no pueden ocurrir
simultáneamente.
Sean:
INSTITUCIÓN CERVANTES 51
INSTITUCIÓN CERVANTES
#A 2 1 #B 1
p ( A) = = = p(B) = =
# E 10 5 # E 10
Calculamos p(A y B) ninguna ficha tiene el número “1” y el “4” a la vez, por lo tanto:
A∩B = ∅ # (A∩B) = 0
# ( A ∩ B) 0
p ( AyB) = = =0
#E 10
#( A ∩ B ) # A + # B # A # B
p ( AoB ) = = = + = p( A) + p( B )
#E #E #E #E
1 1 3
p ( AoB ) = + =
5 10 10
#A 4 2 #A 6 3
p( A) = = = p( A ) = = =
# E 10 5 # E 10 5
52 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
#A 6 3 #B 1
p ( A) = = = p( B) = =
# E 10 5 # E 10
# ( A ∩ B) # B 1
A∩ B = B p ( AyB) = = = p( B) =
#E #E 10
# ( A ∪ B) # A 3
A∪ B = A p ( AoB) = = = p ( A) =
#E #E 5
Responda
¿Los sucesos contrarios son un caso particular de sucesos incluidos?. ¿Por qué?
Probabilidad Condicionada
Existen dos casos en los que se da una probabilidad condicionada: el primero, cuando
analizamos dos sucesos consecutivos; y el segundo, cuando hay un solo evento con dos
sucesos o propiedades que puedan ocurrir simultáneamente, siendo una de esas
propiedades un dato que nos restrinja el espacio con el que vamos a trabajar (Cuando
“sabemos” una característica del suceso).
Supongamos que en una bolsa hay 3 bolillas blancas y 2 rojas. Realizamos dos
extracciones sucesivas. La probabilidad de obtener blanca en la primera es:
3
p( B) = que es la probabilidad simple
5
Por supuesto todos sabemos que esto va a depender de qué hicimos con la bolilla: si la
sacamos de la bolsa o si volvimos a ponerla allí.
Caso 1
La bolilla retirada no se reintegra en la bolsa. Al no hacerlo, la probabilidad de que
salga blanca en la segunda extracción depende de lo que haya salido en la primera.
2 1
p( B ) = = (siendo blanca la primera)
4 2
54 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
3
p( B) = (siendo roja la primera)
4
Probabilidad para la
1º Extracción Nomenclatura
2º Extracción
1 1
BLANCA p( B) = p( B / B ) =
2 2
3 3
ROJA p( B) = p( B / R ) =
4 4
p (B / R)
La otra situación que se puede dar es que la bolilla retirada se reintegre a la bolsa.
Como en la bolsa están las 5 bolillas, la probabilidad de que salga blanca sigue siendo 3/5
Por lo tanto lo que haya salido antes no modifica la situación inicial. Son sucesos
independientes.
Caso 2
En el conjunto E hay fichas blancas y negras. Como podemos apreciar, podemos
clasificar a estas fichas según dos criterios: por el número que tienen o por el color.
Supongamos que una persona a la distancia ve que se extrae una ficha blanca y desea saber la
probabilidad de que tenga el número 3. En este caso, podemos ver que tenemos un “dato” que
nos dice que debemos trabajar con un subconjunto en lugar de hacerlo con el Espacio completo.
p(X/B)=2/6=1/3
donde 2 es la cantidad de fichas blancas con el número 3 y 6 es la cantidad de fichas
blancas.
Por lo tanto:
# (X ∩ B )
p (X / B ) =
#B
Actividades
1. En una bolsa hay 3 bolillas blancas y 5 negras:
a) ¿Cuál es la probabilidad de obtener una bolilla blanca?
b) Se extrae una bolilla y resulta ser blanca. Se vuelve a introducir en la bolsa.
¿Cuál es la probabilidad de que, en la segunda extracción, la bolilla resulte ser
blanca?
c) ¿Cuál hubiera sido la probabilidad si luego de la primera extracción la bolilla no
se hubiera devuelto a la bolsa?
56 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
# (A ∩ B)
p( X / B ) =
#B
#(A ∩ B)
= #E
#B
#E
p( A y B )
=
p (B )
p( A y B ) = p( A / B ) . p( B )
p(B / A) = p(B)
Se tiran 3 monedas
Casos posibles:
A1 C C C
A2 C C X
A3 C X C
A4 X C C
A5 C X X
A6 X C X
A7 X X C
A8 X X X
INSTITUCIÓN CERVANTES 57
INSTITUCIÓN CERVANTES
111 1
p ( A2 ) = p ( CyCyX ) = =
222 8
111 1
p ( A3 ) = p ( CyXyC ) = =
222 8
Probabilidad Compuesta
111 1
p ( A4 ) = p ( XyCyC ) = =
222 8
1 1 1 3
p ( A2 oA3 oA4 ) = + + =
8 8 8 8
58 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
Unidad IV
Distribuciones de probabilidad para
variables aleatorias discretas y continuas
Objetivos
Distinguir entre los distintas funciones de densidad correspondientes a cada variable
aleatoria, ya sea discreta o continua.
Resolver situaciones aplicadas.
INSTITUCIÓN CERVANTES 59
INSTITUCIÓN CERVANTES
Introducción
En cierto sentido el experimento de tirar una moneda, estudiado anteriormente en la
unidad de Probabilidad, ocurre muy a menudo en los negocios. La única diferencia es
que la probabilidad de que salga una cara no es ½.
Considérese una encuesta de mercadeo, realizada para predecir las preferencias para
unos productos. La entrevista de un solo consumidor se parece, en muchos aspectos, al
lanzamiento de una sola moneda, porque el consumidor puede estar a favor de un
producto particular – una cara – o bien puede estar en contra (o indeciso) – una cruz.
En la mayoría de los casos, la fracción de consumidores a favor de un producto particular
no será igual a ½.
Distribución Binomial
Definición
Un experimento binomial es un experimento que posee las siguientes propiedades:
60 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
n!
p( x ) = p xqn - x x = 0;1;2; 3;...; n
x !(n - x ) !
Ejemplo
Se inspeccionan los grandes lotes de productos que llegan a una planta manufacturera
a fin de encontrar artículos defectuosos, mediante un plan de muestreo. Se selecciona
una muestra aleatoria de n artículos de cada uno de los lotes y se inspeccionará la
muestra, anotando el número x de defectuosos. Si x es menor que o igual a algún número
de aceptación a ya especificado, se aceptará el lote. Si x es mayor que a, se rechazará el
citado lote.
Solución
Como el lote contiene 5% de defectuosos, la probabilidad de que un artículo, sacado de
ahí, sea defectuoso es p = 0.05. Entonces la probabilidad de observar x defectuosos en
una muestra de n = 10 artículos es:
10!
p( x ) = 0.05x 0.9510- x
x !(10 - x ) !
10! 10!
p(aceptar ) = p(0) + p(1) = 0.050 0.9510- 0 + 0.0510.9510- 1
0 !(10 - 0) ! 1!(10 - 1) !
= 0.914
p(rechazar ) = 1 - p(aceptar )
= 1 - 0.914
= 0.086
INSTITUCIÓN CERVANTES 61
INSTITUCIÓN CERVANTES
Distribución de Poisson
Esta distribución de probabilidad es un buen modelo para la distribución de
frecuencias relativas del número de eventos raros que ocurren en una unidad de tiempo,
de distancia, de espacio, etc. Por esta razón se la utiliza mucho en administración de
empresas para modelar la distribución de frecuencias relativas del número de accidentes
industriales por unidad de tiempo o por administradores de personal, para modelar la
distribución de frecuencias relativas del número de accidentes de los empleados o el
número de reclamaciones de seguros, por unidad de tiempo. La distribución de
probabilidad de Poisson puede proporcionar, en algunos casos, un buen modelo para la
distribución de frecuencias relativas del número de llegadas por unidad de tiempo, a una
unidad de servicio (por ejemplo, el número de pedidos recibidos en una planta
manufacturera o el número de clientes que llegan a una instalación de servicio, a una
caja registradora de un supermercado, etc.).
l e- l
p( x ) = x = 0;1;2;...; ¥
x!
donde x = numero de eventos raros por unidad de tiempo, de dis t an cia, de espacio, etc..
Media = el simbolo l que aparece en p (x )
Ejemplo
Las lesiones laborales graves que ocurren en una planta siderúrgica, tienen un
promedio o media anual de 2.7. Dado que las condiciones de seguridad serán iguales en
la planta durante el próximo año, ¿cuál es la probabilidad de que el número de lesiones
graves sea menor que dos?
Solución
62 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
Por lo tanto, la probabilidad que haya a menos de dos lesiones laborales graves el
próximo año en la planta fabril de acero, es de 0.249.
X • continua → F(xi) = ∫
xi
f ( x) .dx →la probabilidad de que aparezca
−∞
cualquier valor hasta “xi”
F(x)
x
Fig. 4.1. Distribución de probabilidad para una variable aleatoria continua
INSTITUCIÓN CERVANTES 63
INSTITUCIÓN CERVANTES
2
e - ( x - m) 2 s 2
f (x ) = (- ¥ < x< ¥ )
s 2p
64 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
Se simboliza X N ( µ , σ ) y se lee:
µ-σ µ µ+σ
La ecuación para la función de densidad se deduce de manera que el área bajo la curva
representará la probabilidad. Por lo tanto el área total bajo la curva es igual a 1.
P(a< x
a µ b
Fig. 4.3. Probabilidad P(a< x <b) para una variable aleatoria distribuida
normalmente.
A fin de evaluar las áreas bajo la curva normal, observamos que la ecuación para la
distribución de probabilidad normal, depende de los valores numéricos de m y s y que
podemos generar un número infinitamente grande de distribuciones normales dando
INSTITUCIÓN CERVANTES 65
INSTITUCIÓN CERVANTES
Como la curva normal es simétrica respecto a su media, la mitad del área bajo la curva
se encuentra a la izquierda de la media y la otra mitad a la derecha. También, debido a
la simetría se puede simplificar la tabla de las áreas listándolas entre la media y un
número especificado z de desviaciones estándares a la derecha de m . Las áreas a la
izquierda de la media se pueden calcular utilizando el área correspondiente e igual a la
derecha de la media. La distancia de un valor dado de x a la media es (x - m) .
x- m
z =
s
Nótese que existe una correspondencia uno a uno entre z y x y que, en particular,
z = 0 cuando x = m . El valor de z será positivo cuando x esté por arriba de la
media, y negativo, cuando x sea menor que dicha media. La distribución de
probabilidad de z muchas veces se designa por distribución normal estandarizada,
pues su media es igual a cero y su desviación estándar es igual a 1. Se muestra la
distribución en la Fig. 4.4. El valor bajo la curva normal entre la media z = 0 y un valor
especificado de z > 0 , por ejemplo, z0 , es la probabilidad P(0 £ z £ z0 )
µ=0 z0
Ejemplo 1
Obtenga P (0 £ z £ 1.63) . Esta probabilidad corresponde al área entre la media
( z = 0) y un punto z = 1.63 desviaciones estándares a la derecha de la media (véase la
Fig. 4.5).
66 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
P (0 £ z £ 1.63) =0.4
484
0 1.63
Ejemplo 2
Calcular P (- 0.5 £ z £ 1) . Esta probabilidad corresponde al área entre ( z = - 0.5) y
( z = 1.0) , como se muestra en la Fig. 4.6.
A1
A2
-0.5 0 1.0
Solución
A = A1 + A2
= 0.1915 + 0.3413
= 0.5328
INSTITUCIÓN CERVANTES 67
INSTITUCIÓN CERVANTES
Actividades
Una vez aprendidos y estudiados los conceptos expuestos en las Unidades III y IV está
en condiciones de realizar el siguiente trabajo práctico, usando el programa estadístico
Infostat.
Para realizar este práctico, utilizamos la misma tabla de datos con la que hemos
realizado el trabajo práctico anterior.
Ejemplo
La producción de una empresa papelera responde a una distribución Normal de media
527 Kg. diarios de papel y varianza 126 Kg2.
Solución
Como en este caso tenemos una distribución Normal, una vez abierto el archivo de
datos con el que trabajaremos, procedemos de la siguiente manera:
Entonces, una vez abierto el archivo de datos realizo los pasos especificados
anteriormente:
1) Activo el menú ESTADISTICAS, dentro de él la opción
PROBABILIDADES Y CUANTILES y dentro de este último la opción
NORMAL (en este caso), es decir la siguiente secuencia
68 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
2) Una vez que estamos en este cuadro agregamos los valores requeridos de la
media (527) y la varianza (126) de la variable. Escribiendo también el valor
de la probabilidad que quiero calcular (512). Calculando, obtengo:
INSTITUCIÓN CERVANTES 69
INSTITUCIÓN CERVANTES
Para obtener la probabilidad de que un día determinado se produzca entre 528 y 531
Kg., obtenemos primero la probabilidad correspondiente para 531Kg, luego la
correspondiente para 528Kg y las restamos. El valor que se obtiene de esta resta es el
valor buscado. Es decir:
Es decir que la probabilidad de que un día determinado se produzca entre 528 y 531
Kg., es de 0,1037 ó del 10,37%.
Ahora sí realice Ud. el mismo trabajo con las variables indicadas. Para ello guíese
8 con las pautas establecidas en el 2º Trabajo Práctico, que se presenta en el
Cuadernillo de Actividades.
70 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
Unidad V
Intervalos de confianza para la media
Objetivos
1. Construir intervalos de confianza para distintos parámetros e interpretarlos
correctamente.
2. Resolver situaciones aplicadas.
INSTITUCIÓN CERVANTES 71
INSTITUCIÓN CERVANTES
Introducción
La obtención de un estimador por intervalo equivale a tratar de agarrar con un lazo a
un novillo inmóvil. En este caso, el parámetro que se quiere estimar corresponde al
novillo, y el intervalo, al lazo del vaquero. Cada vez que uno saca una muestra se
obtiene un intervalo de confianza para un parámetro y se espera ¨enlazarlo¨-es decir,
incluirlo en el intervalo. No se tendrá éxito en toda muestra, pero un buen estimador por
intervalo tendrá una alta probabilidad de incluir el parámetro estimado.
Supóngase, para considerar un caso práctico, que se desean estimar los réditos medios
de bonos municipales de clase AA. Si tuviéramos que seleccionar 10 muestras, cada una
de n = 30 tasas de interés, para 30 bonos municipales y definir un intervalo de confianza
para la media poblacional m para cada ejemplo, los intervalos podrían aparecer como se
ve en la Fig. 5.1. Los segmentos de recta horizontales representan los 10 intervalos, y la
línea vertical indica la localización de la verdadera tasa media de interés para los bonos
en cuestión. Notesé que el parámetro es fijo y la localización y el ancho del intervalo
varían de una muestra a la otra. De esta manera hablamos de la ¨probabilidad de que el
intervalo contenga a m ¨ y no de la ¨probabilidad de que m esté en el intervalo¨, porque
m es fijo. El intervalo es aleatorio.
M
U
ES
T
R
A
Fig. 5.1. Diez intervalos de confianza para los réditos medios de bonos
municipales de clase AA (con base en una muestra de n = 30 observaciones).
72 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
0.
1.96 s qˆ q̂ 1.96 s qˆ
Como el intervalo que describimos arriba contendrá a q con una probabilidad de 0.95,
se le llama intervalo de confianza de 95%. La probabilidad de que el mismo contenga a
q se llama coeficiente de confianza para el intervalo citado. Los límites inferiores y
superiores del intervalo de confianza se denominan límite inferior y límite superior de
confianza (LIC y LSC), respectivamente. Así,
INSTITUCIÓN CERVANTES 73
INSTITUCIÓN CERVANTES
za 2 s
x±
n
a
donde za 2 = valor z que corresponde al área 2 en el extremo superior de una
distribución normal estándar z.
n = tamaño muestral.
s = desviación estándar de la población muestreada.
Suposición: n ³ 30 .
Ejemplo 1
Encuentre un intervalo de confianza de 90% para la media de la tasa principal para
préstamos.
Solución
o bien
s
x ± 1.645
n
0.24
9.1 ± (1.645)
50
o bien
9.1 ± 0.0558
Así se ve que la media de la tasa principal para préstamos se encuentra entre 9.0442% y
9.1558%. ¿Podemos asegurar que este intervalo particular contiene a m ? No, pero sí hay
74 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
Ejemplo 2
Una corporación quiere emitir algunos pagarés a corto plazo y espera que los intereses
que tendrá que pagar no sean mayores que 11.5%. Para obtener cierta información
acerca de la tasa media de interés que habría de pagar, la corporación pone a la venta 40
pagarés, uno a través de cada una de 40 firmas de corretaje. La media y la desviación
estándar para las cuarenta tasas de interés, eran x = 10.3% y s = 0.31% . Como
solamente interesa el límite superior de la tasa de interés que hay que pagar, hallar un
intervalo de confianza unilateral superior de 95% para la tasa media de interés que
pagaría la corporación para los pagarés.
Solución
Puesto que el coeficiente de confianza es 0.95, a = 0.05 y z0.05 = 1.645 . Por lo tanto,
el intervalo de confianza unilateral superior de 95%, para m es,
z0.05 s
x±
n
o bien
s
x ± 1.645
n
o bien
LSC = 10.3 + 0.0806 = 10.3806
Así estimamos que la tasa media de interés, que la corporación tendrá que pagar para
sus pagarés, es menor que 10.3806%. ¿Qué tanta confianza puede tenerse en esta
conclusión? Hay mucha seguridad, porque sabemos que la probabilidad de que el
intervalo de confianza unilateral contenga a m , es 0.95.
INSTITUCIÓN CERVANTES 75
INSTITUCIÓN CERVANTES
Una vez aprendidos y estudiados los conceptos expuestos en esta Unidad está en
condiciones de realizar el siguiente trabajo práctico, usando el programa estadístico
Infostat.
Para realizar este práctico, utilizamos la misma tabla de datos con la que hemos
realizado los trabajos prácticos anteriores.
Ejemplo:
Supongamos que se quiere obtener un intervalo de confianza del 95% para el promedio
o media de la variable SUELDO.
Entonces, una vez abierto el archivo de datos realizo los pasos especificados
anteriormente:
76 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
INSTITUCIÓN CERVANTES 77
INSTITUCIÓN CERVANTES
5. Algo muy importante que hay que realizar con todo resultado estadístico es una
correcta interpretación del mismo, así nuestro resultado es:
78 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
Ahora Ud. realice el mismo trabajo con el resto de las variables, por supuesto, para
8 las que tenga sentido calcularlo.
Para ello guíese con las pautas establecidas en el 3º Trabajo Práctico, que se
presenta en el Cuadernillo de Actividades.
INSTITUCIÓN CERVANTES 79
INSTITUCIÓN CERVANTES
80 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social
Indice
Fundamentación ..................................................................... 1
Objetivos generales ................................................................ 1
Contenidos............................................................................. 2
Propuesta metodológica ......................................................... 3
Evaluación.............................................................................. 3
Bibliografía ............................................................................ 4
Evaluación Diagnóstica ........................................................... 5
U NIDAD I
Presentación de los Datos ...................................................... 7
Objetivos ............................................................................................................... 7
Introducción .......................................................................... 8
Estadística descriptiva............................................................................................ 9
Estadística inferencial............................................................................................. 9
Métodos utilizados para analizar un determinado conjunto de datos................. 10
Recolección de los datos........................................................................................................10
Presentación y caracterización de los datos .........................................................................10
Gráficos................................................................................................................ 13
Gráficos de barras (Serie de Frecuencias) ...........................................................................14
Gráficos de sectores ...............................................................................................................16
Histograma – Polígono de frecuencia..................................................................................17
U NIDAD II
Análisis y medición de datos ................................................. 19
Objetivos ............................................................................................................. 19
Cálculo, descripción y medición de datos ........................................................... 20
Parámetros de posición. Serie simple ................................................................ 21
Promedio................................................................................................................................21
Mediana .................................................................................................................................22
Modo ......................................................................................................................................23
Parámetros de dispersión. Serie simple ............................................................. 23
Desvíos ...................................................................................................................................23
Desviación media ..................................................................................................................25
Varianza .................................................................................................................................25
Desviación estándar...............................................................................................................26
Parámetros de posición. Serie de frecuencias.................................................... 28
Promedio................................................................................................................................28
Mediana .................................................................................................................................29
Modo ......................................................................................................................................29
Parámetros de dispersión. Serie de frecuencias................................................. 30
Desviación Media..................................................................................................................30
Varianza .................................................................................................................................31
Desviación estándar...............................................................................................................31
Parámetros de posición. Serie de intervalos de clase ........................................ 32
Promedio................................................................................................................................32
Mediana .................................................................................................................................33
Parámetros de dispersión. Serie de intervalos de clase ..................................... 33
Desviación media ..................................................................................................................33
Varianza .................................................................................................................................34
INSTITUCIÓN CERVANTES 81
INSTITUCIÓN CERVANTES
U NIDAD III
Probabilidades...................................................................... 45
Objetivos.............................................................................................................. 45
Contenidos que Ud. debe tener en claro antes del estudio de esta unidad ....... 45
Probabilidades...................................................................................................... 46
Introducción al concepto de probabilidad ........................................................... 46
Actividades........................................................................................................... 49
Probabilidad de 2 sucesos.................................................................................... 49
Casos particulares................................................................................................ 51
I- Sucesos Excluyentes.......................................................................................................... 51
II- Sucesos Contrarios .......................................................................................................... 52
III- Sucesos Incluidos ........................................................................................................... 53
Responda ............................................................................................................. 53
Probabilidad Condicionada .................................................................................. 54
Actividades........................................................................................................... 56
Principio de Probabilidad Compuesta ................................................................. 56
U NIDAD IV
Distribuciones de probabilidad para variables aleatorias
discretas y continuas .............................................................. 59
Objetivos.............................................................................................................. 59
Introducción......................................................................................................... 60
Distribución Binomial........................................................................................... 60
Distribución de Poisson ....................................................................................... 62
Variables Aleatorias Continuas ............................................................................ 63
Distribución de Probabilidad Normal.................................................................. 64
Tabulación de las áreas de la distribución de probabilidad normal ..................... 65
Actividades........................................................................................................... 68
U NIDAD V
Intervalos de confianza para la media ................................... 71
Objetivos.............................................................................................................. 71
Introducción......................................................................................................... 72
Estimación de la Media Poblacional ..................................................................... 73
82 INSTITUCIÓN CERVANTES
Área Empresarial
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística – Actividades
Actividades
Unidad I
1. Se hizo un censo entre los alumnos de un curso para saber la cantidad de hermanos
que tienen. Los resultados obtenidos son los siguientes:
2, 2, 1, 2, 3, 3, 2, 3, 2, 2, 1, 3, 2, 2, 4, 4, 2, 2, 4, 1, 5, 5, 2, 7, 3, 2, 6, 3
2, 3, 3, 2, 3, 4, 7, 1, 3, 3, 2, 3, 6, 1
a) Construya la serie simple.
b) Construya la serie de frecuencias.
c) Construya la serie de intervalos de clase.
d) Señale qué tipo de atributo es el que se está estudiando.
3. Preguntando a 120 personas sobre su estado civil, se han obtenido los siguientes
resultados:
Están solteros 45, están casados 50, están viudos 15, están divorciados 10.
¿Cuál es la variable en estudio y de qué tipo es?
Realice la tabla que muestre los resultados obtenidos y que muestre las
frecuencias y frecuencias relativas de cada dato.
Peso en Numero de
Gramos especímenes
[ 0 – 20 ) 16
[ 20 – 40 ) 38
[ 40 – 60 ) 35
[ 60 – 80 ) 20
[ 80 – 100 ) 11
[ 100 – 120 ) 4
[ 120 – 140 ) 1
Total 125
2 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística – Actividades
Unidad II
1. Se dan las notas obtenidas por los alumnos en un examen final:
5; 7; 7; 10; 6; 2; 3; 8; 4; 5; 8; 5; 7; 6; 10; 6; 7; 8; 6; 1; 6; 4; 6; 5; 7; 7; 4; 3; 9; 7; 8; 5.
a) Construye la serie de frecuencias y calcular, x ,Me, y Mo.
b) Construye el histograma, el polígono de frecuencias y el gráfico de
barras.
c) Calcula el promedio, la mediana y el modo para la serie de intervalos
de clase: [0-2) [2-4) [4-6) [6-8) [8-10) [10-12].
x 1 12 3 4 5 6 7 8 9 10
f 28 46 60 100 94 126 78 46 33 12
4. En 5 intentos, una persona requirió de 12, 18, 14, 11 y 15 minutos para cambiar el
aceite de una marca particular de automóvil. Calcule la desviación estándar de
esta muestra.
5. En cuatro días, una persona requirió de 37, 32, 35 y 41 minutos para llegar de un
trabajo a otro:
a) Calcular la desviación estándar de estos datos.
b) Sustraiga 30 a cada uno de estos datos, tome estas nuevas cifras, como
una nueva serie y luego calcule su desviación estándar.
c) ¿Qué regla general sugiere esto para simplificar el cálculo de la
desviación estándar?
INSTITUCIÓN CERVANTES 3
INSTITUCIÓN CERVANTES
6. Los registros de una aerolínea demuestran que los vuelos entre dos ciudades
llegan en promedio 5,4 minutos tarde con una desviación estándar de 1,4.
Averiguar, ¿Por lo menos que porcentaje de estos vuelos llegan con un retraso
comprendido entre 2,6 y 8,2 minutos?
10. Calcula la desviación estándar del ejercicio 1 de al Unidad II. ¿Cómo se agrupan
los datos en torno al promedio?
12. Los modelos con dos años de antigüedad de cierta marca de automóvil se han
estado vendiendo, en promedio a $7860 con una desviación estándar de $820, en
tanto que los modelos con tres años de antigüedad de la misma marca cuestan en
promedio $6400 con una desviación estándar de $960.
Un modelo con dos años de antigüedad valuado en $6960 ¿es una mejor oferta
que un modelo con tres años de antigüedad valuado en $5400 sin tomar en cuenta
todas las demás consideraciones?.
Pollo : 46, 55, 43, 48, 54, 65, 36, 40, 51, 53, 64, 32, 41, 46
Carne : 39, 41, 45, 30, 46, 36, 37, 23, 30, 33, 50, 44, 41, 28
4 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística – Actividades
15. Para los salarios del problema anterior, describa su distribución en términos de
asimetría.
16. Si estuviera Ud. en cada una de las siguientes situaciones, señale que medida de
posición reportaría para los datos del problema 14 de la Unidad II y en qué
sentido puede considerarse "típico" cada valor.
17. Suponga que tiene una lista de los precios de un artículo de consumo popular en
22 áreas metropolitanas que varían considerablemente en tamaño y ventas de ese
articulo. Se calculan:
a) La mediana.
b) El promedio para esos datos.
Describa el significado que tendría cada uno de esos valores.
X f Xm Xm*f fa
[ 10 - 19 ] 3 14,5 43,5 3 X= tiempos de auditoria
[ 20 - 29 ] 5 24,5 122,5 8
[ 30 - 39 ] 10 34,5 345,0 18 f=numero de registros
[ 40 - 49 ] 12 44,5 534,0 30
[ 50 - 59 ] 20 54,5 1090,0 50
Total 50 2135
INSTITUCIÓN CERVANTES 5
INSTITUCIÓN CERVANTES
20. El número de automóviles que vendió cada uno de los 10 vendedores de una
distribuidora en un mes específico, en orden ascendente, es: 2, 4, 7, 10, 10, 10, 12,
12, 14 y 15. Determine para la población:
a) El promedio.
b) La mediana.
c) La moda.
Para el número de automóviles vendidos.
21. Determine el coeficiente de variación para los datos de salarios analizados en los
problemas 14 de la Unidad II.
A- Para la misma empresa industrial del problema 14 de la Unidad II, el salario
diario promedio de una muestra de supervisores, es: x = $730750, con
S= $45520.
Determine el coeficiente de variación para estos salarios.
6 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística – Actividades
Trabajo Práctico Nº 1
Objetivos generales
El alumno deberá estar capacitado para:
Agrupar correctamente cada conjunto de datos e interpretar las frecuencias de los
mismos.
Reconocer y describir los distintos tipos de variables.
Representar cada variable, a través de las correspondientes tablas y gráficos.
Objetivos específicos
El alumno deberá estar capacitado para:
Implementar las opciones “Medidas Resúmenes” y “Frecuencias” del software
estadístico INFOSTAT.
Implementar las opciones “Histograma” y “Diagrama de Barras” del mismo
software.
Bibliografía y materiales
Módulo.
Guía de Actividades.
Mendenhall, William, Estadística para Administradores. Grupo Editorial
Iberoamérica. 1990.
Kazmier, L. y Diaz Mata, A., Estadística Aplicada a la Administración y Economía.
McGraw Hill. 1996.
Infostat (CD y Manual del Usuario).
Palabras claves
Población – Muestra – Variable – Posición - Dispersión – Frecuencia – Simetría –
Atributo – Discreta – Continua – Parámetro – Estimador – Media – Varianza –
Desviación estándar – Kurtosis.
INSTITUCIÓN CERVANTES 7
INSTITUCIÓN CERVANTES
Orientación
¿Cómo puedo describir, en pocas palabras o valores, un conjunto de datos?
¿Cómo puedo describir, gráficamente una variable?
¿Podré describir de la misma forma a las variables discretas que a las continuas?
¿Podré agruparlas de la misma forma?
¿Qué gráfico es adecuado para cada una de ellas?
¿Qué está representando realmente con cada gráfico?
¿Hay diferencia entre tener parte de la información con tener la totalidad de la
misma? (Población – Muestra - Representatividad). ¿Cuáles son esas diferencias?
¿Puedo asegurar que las medidas que presento son efectivamente las reales?
(Parámetro - Estimador)
Las medidas de posición, ¿son indistintas para la representación de cualquier
variable? ¿Por qué?
D Sugerencia
Realice los ejercicios de la Guía de Actividades, correspondientes a las Unidades I y
II.
Actividades
Deberá presentar un informe impreso en Word, con:
Criterios de evaluación
Se evaluará:
Que las medidas descriptivas estén correctamente especificadas con sus respectivas
unidades de medida.
Que cada gráfico exprese alguna característica particular de interés.
Que no se presenten redundancias.
Que cada medida resumen o gráfico tenga su correspondiente comentario
explicativo.
Que cada comentario se corresponda con la medida o gráfico que aluda.
8 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística – Actividades
Unidad III
1. Se arrojan 2 dados: uno rojo y uno blanco.
a) ¿Estos sucesos son dependientes o independientes?
b) ¿Cuál es la probabilidad de obtener 1 en el rojo y 6 en el blanco?
c) ¿Cuál es la probabilidad de obtener 1 en el blanco y un número par en el rojo?
d) ¿Cuál es la probabilidad de obtener 3 en el blanco y 4 o 6 en el rojo?
e) ¿Cuál es la probabilidad de obtener un 1 y un 3?
3. Para realizar un estudio sobre los peces que habitan un lago del sur, se hace una
encuesta entre los pescadores de la zona. Se les pregunta qué tipo de peces han
extraído del lago y cuántos de cada uno. Con los datos recopilados se construye la
siguiente tabla de frecuencias:
a) Con estos datos: ¿Cuál se estima que es la probabilidad de obtener una trucha de
ese lago?
b) Se supone que en el lago hay 2000 peces: ¿Cuántas truchas estima que hay?
Problemas de aplicación
1. (Clasificación de empleados) Una empresa tiene 60 personas con diploma de
preparatoria en su equipo, 28 de los cuales habían cursado computación en la
preparatoria. De estos empleados, 39 aún no cumplen los 40 años de edad; entre
estos 39, 21 habían cursado computación en la preparatoria. Si se elige al azar una
persona entre las 60, ¿cuál es la probabilidad de que tenga más de 40 años y no tenga
conocimientos de computación?
INSTITUCIÓN CERVANTES 9
INSTITUCIÓN CERVANTES
3. En cierta comunidad, 70% de las personas fuman; 40% tiene cáncer pulmonar y 25%
fuma y tiene cáncer pulmonar. Si S y L denotan los eventos de fumar y tener cáncer
pulmonar (completando la tabla adjunta)
S S’
L
L’
1
T T’
C
C’
1
10 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística – Actividades
9. (Publicidad por televisión) Una compañía estima que el 30% de la población ha visto
un anuncio por televisión de su detergente en polvo. De todos los que han visto el
anuncio, el 10% comprará el producto más tarde. ¿Qué proporción de la población
ha visto el anuncio y ha comprado el producto? Si el 5% de los que no vieron el
anuncio compraron el jabón en polvo, calcule esta probabilidad:
a) Que un individuo seleccionado al azar haya comprado el jabón en polvo.
b) Que una persona que haya comprado el jabón en polvo no haya visto el anuncio.
10. (Perfil de los usuarios de tarjetas de crédito) Una compañía de tarjetas de crédito
descubre que el 40% de sus clientes viven en áreas urbanas y que el 60% viven en
suburbios o en áreas rurales. De los clientes, el 30% promedian más de $200 al mes
en operaciones con su tarjeta de crédito y el 10% viven en áreas urbanas y gastan más
de $200 al mes. Calcule la probabilidad de que un cliente dado viva en un área
urbana determinada y tal cliente gaste menos de $200 al mes usando su tarjeta de
crédito.
INSTITUCIÓN CERVANTES 11
INSTITUCIÓN CERVANTES
Unidad IV
Trabajo Práctico Nº 2
Objetivos generales
El alumno deberá estar capacitado para:
Identificar correctamente las distintas Distribuciones: Binomial, Poisson, Normal.
Calcular probabilidades específicas, una vez conocida la distribución de la variable
en estudio.
Objetivos específicos
El alumno deberá estar capacitado para:
Implementar la opción “Probabilidades” del software estadístico INFOSTAT.
Generar variables, teniendo distribuciones prefijadas.
Bibliografía y materiales
Módulo.
Guía de Actividades.
Mendenhall, William. Estadística para Administradores. Grupo Editorial
Iberoamérica. 1990.
Kazmier, L. y Diaz Mata, A. Estadística Aplicada a la Administración y Economía.
McGraw Hill. 1996.
Infostat (CD y Manual del Usuario).
Palabras claves
Evento – Variable Aleatoria – Probabilidad – Esperanza Matemática – Distribución de
probabilidades – Densidad – Binomial – Poisson – Normal – Normal Estándar.
12 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística – Actividades
Orientación
¿Que entiende Ud. por probabilidad?
La probabilidad ¿puede ser un número cualquiera o tiene algunas restricciones?
¿Cómo podría medir la cantidad de éxitos en una muestra?
¿Cómo podría medir la probabilidad de que lleguen 7 autos por minuto a una
estación de peaje, sabiendo que llegan, en promedio, 5 por minuto?
¿Cuáles son las principales diferencias entre una variable aleatoria que tiene una
distribución Binomial y una que tiene distribución Poisson?
¿Qué entiende por probabilidad acumulada de una variable aleatoria?
¿Si una variable aleatoria es continua ¿qué distribución podría ser adecuada para
describirla?
¿Cómo debería ser el histograma de una variable aleatoria con distribución Normal?
¿Qué características deberíamos tener en cuenta para poder asumir que una variable
aleatoria tiene distribución Normal?
Actividades
Deberá presentar un informe impreso en Word, con los siguientes cálculos:
Denominando con X a la variable aleatoria Estatura, y sabiendo que ésta tiene una
distribución Normal, calcular:
la probabilidad de que un empleado de la empresa, elegido al azar, mida
exactamente 1.67 mts.
la probabilidad de que un empleado de la empresa, elegido al azar, mida menos de
1.67 mts.
la probabilidad de que un empleado de la empresa, elegido al azar, mida entre 1.70
mts y 1.80 mts.
la probabilidad de que un empleado de la empresa, elegido al azar, mida 1.67 mts o
menos.
la probabilidad que entre los empleados de la empresa que miden 1.72 mts, uno de
ellos sea de sexo femenino.
la probabilidad que entre los empleados de la empresa que miden 1.67 mts, uno de
ellos sea de sexo masculino.
la probabilidad que entre los empleados de la empresa que miden 1.79 mts, tres de
ellos sean de sexo femenino.
la probabilidad que entre los empleados de la empresa que miden 1.65 mts, tres de
ellos sean de sexo masculino.
la probabilidad que entre los empleados de la empresa que miden 1.65 mts, tres de
ellos sean de sexo femenino.
la probabilidad que entre los empleados de la empresa que miden 1.75 mts, uno o
más de ellos sean de sexo femenino.
la probabilidad que entre los empleados de la empresa que miden 1.75mts, tres de
ellos o menos sean de sexo masculino.
INSTITUCIÓN CERVANTES 13
INSTITUCIÓN CERVANTES
Criterios de evaluación
Se evaluará:
Que los cálculos realizados estén correctamente especificados.
Que cada cálculo realizado tenga su correspondiente comentario o interpretación
explicativa.
Que cada comentario se corresponda con el cálculo al que alude.
Que el informe contenga una descripción exhaustiva de cada variable tratada y sus
correspondientes distribuciones.
La presentación, considerando el formato, la organización y la claridad.
14 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística – Actividades
Trabajo Práctico Nº 3
Objetivos generales
El alumno deberá comprender los conceptos de Estimador y Confianza
Objetivos específicos
El alumno deberá estar capacitado para:
Implementar la opción “Intervalos de Confianza” (del Menú
Estadísticas→Estimación de Características Poblacionales→Muestreo Aleatorio
Simple) del software estadístico INFOSTAT.
Bibliografía y materiales
Kazmier, L. y Diaz Mata, A. Estadística Aplicada a la Administración y Economía.
McGraw Hill. 1996.
Mendenhall, William. Estadística para Administradores. Grupo Editorial
Iberoamérica. 1990.
Infostat (CD y Manual del Usuario).
Palabras claves
Estimación – Estimación puntual - Intervalos de Confianza – Error de Estimación.
Orientación
¿Cómo podemos estimar puntualmente el valor de la media poblacional?
¿Cómo podemos estimar puntualmente el valor de la varianza poblacional?
¿Cómo podemos tener una idea del error que cometemos al estimar?
¿Con qué tamaño de muestra es conveniente trabajar, para poder utilizar la
distribución normal en las estimaciones?
Además de una estimación puntual para los parámetros de la población, ¿puede
obtenerse un rango de valores para los mismos?
¿Cuál es la diferencia entre estas dos clases de estimaciones?
INSTITUCIÓN CERVANTES 15
INSTITUCIÓN CERVANTES
Actividades
Deberá presentar un informe impreso en Word, con los siguientes cálculos:
Realice una estimación puntual de la media de la variables: Sueldos, Bonos, Hijos,
Horas Extras, Estatura, etc.
Realice un intervalo del 90% de confianza para cada una de las estimaciones
anteriores.
Deberá explicar oralmente, los criterios utilizados y los resultados obtenidos (Cada
integrante del grupo).
No se aceptarán planillas de cálculo.
Criterios de evaluación
Se evaluará:
Que los cálculos realizados estén correctamente especificados.
Que cada cálculo realizado tenga su correspondiente comentario o interpretación
explicativo.
Que cada comentario se corresponda con el cálculo al que alude.
Que el informe contenga una descripción exhaustiva de cada variable tratada y sus
correspondientes estimaciones.
La presentación, considerando el formato, la organización y la claridad.
16 INSTITUCIÓN CERVANTES