Separata #01
Separata #01
Separata #01
APUNTES DE ESTADISTICA
A LA EDUCACION
Y
y *n
i i
Huaraz, 2005
ESTAD I STICA
Breve reseña histórica
a. Etapa inicial.- Se extiende desde la antigüedad hasta mediados del siglo XVIII.
La escuela Inglesa.- Cuantificaron las leyes que rigen los fenómenos sociales; como
consecuencia, "aritmetizaron” la estadística.
c. Etapa actual.- Comprendida entre principios del siglo XIX hasta nuestros días. En
esta etapa la matemática se plasma como la columna vertebral de la estadística y se
caracteriza por el gran desarrollo alcanzado como ciencia y como una metodología de
la investigación científica aplicada a todas las ramas del saber humano: Medicina,
biología, química, educación, industria, comercio, etc.
La mayoría de quienes ejercen sus profesiones, unos más otros menos, suelen dar por
sentado el conocimiento de métodos estadísticos como parte esencial de su labor. El
2
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
Probablemente no hay otra materia que muestre tan claramente que hay diversas clases
de inteligencia. Nada menos que Charles Darwin, de inteligencia tan vigorosa, tenía
dificultades con la estadística, algo que según se dice admitía francamente. Su primo Sir
Francis Galton, casi tan ilustre como él, y que tanto ha hecho por introducir la estadística
en psicología, tenía que apelar a otros en busca de ayuda para sus problemas
matemáticos.
Hay maneras distintas de entender las mismas cosas. Un estudiante captará las nuevas
ideas de la estadística del mismo modo como las entiende un matemático; otro apreciará
las reglas lógicas del pensar y los conceptos aducidos como instrumentos de la reflexión;
y algún otro llegará a dominar las operaciones prácticas y a efectuar los cálculos con una
mínima comprensión de lo que significan.
Aprender sin llegar a penetrar en la íntima naturaleza de las cosas y sin apreciarla, es
aprender sin verdadera disposición y entusiasmo y no es nada satisfactorio.
Para ser más explícito, hay cuatro razones simples e innegables por los cuales los
estudiantes que tomen un curso de estadística como requisito deben alcanzar cierto
dominio de esta materia.
3. Conocer los aspectos del pensamiento estadístico como un componente esencial de una
educación humanística.
3
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
1. Permiten el tipo de descripción más exacto. Cuando todo está dicho y echo, el objetivo de
la ciencia es la descripción de fenómenos, descripción que ha de ser tan completa y
tan precisa que sea útil para quien pueda entenderla al leer los símbolos en términos
de los cuales se describen esos fenómenos. La matemática y la estadística hacen parte
de nuestro lenguaje descriptivo, son una elaboración de nuestros símbolos verbales,
especialmente adaptados al tipo de descripción eficaz que exige el científico.
3. Nos permiten resumir los resultados de una manera significativa y cómoda. Las masas de
observaciones en sí mismas son abrumadoras y casi que carecen de significado. Antes
de que podamos ver el bosque al tiempo que los árboles, hay que poner orden en los
datos. La estadística nos ofrece medios incomparables para ordenar el caos, para ver
el panorama general en los resultados que se tienen.
5. Nos permite predecir “qué tanto” sucederá de algo en ciertas condiciones que conocemos y que
hemos medido. Por ejemplo, podemos predecir la nota probable de un estudiante de
primer año en álgebra, si conocemos la puntuación del estudiante en una prueba de
aptitud académica general, la puntuación en una prueba de aptitud especial en
álgebra, la nota promedio en matemáticas de la escuela secundaria y tal vez el
4
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
6. Nos permiten analizar algunos de los factores casuales subyacentes en sucesos complejos y que
de otra manera nos confundirían. En las ciencias sociales y en la educación en común con
ellas, es por lo general cierto que todo suceso o resultado se debe a numerosos
factores casuales. Las razones por la que una persona fracasa en una empresa o en
una profesión, por ejemplo, son variadas y numerosas. Los factores causales por lo
general se descubren y demuestran de la mejor manera por el método experimental.
Si se pudiera demostrar que, manteniendo constantes todos los demás factores,
ciertos empresarios fracasan en el grado en que poseen cierto defecto “X” de
personalidad - un rasgo - entonces es probable que X sea una causa de fracaso en ese
tipo de empresas.
Desafortunadamente, quien ejerce las ciencias sociales no puede tratar las personas y
sus negocios lo suficientemente para poner en marcha un buen experimento de este
tipo. Lo mejor que se puede hacer es un estudio estadístico, tomando a los
empresarios tal como los encontramos, trabajando en condiciones normales. Los
métodos estadísticos son por consiguiente y a menudo un sustituto necesario de los
experimentos. Incluso cuando son posibles los experimentos, los datos
experimentales deben someterse de ordinario a un tratamiento estadístico apropiado.
Los métodos estadísticos son por tanto los compañeros constantes de los
experimentos.
Etapas de la investigación
5
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
Formulación de hipótesis.
Procedimientos de medición.
Procedimientos de captación.
Al plantear los objetivos el investigador debe determinar qué técnicas estadísticas le van
a permitir alcanzar dichos objetivos. Es cierto, por otro lado, que no necesariamente
todos los objetivos serán alcanzados utilizando la Estadística; sin embargo en la
Planificación así como en la ejecución de los estudios de investigación, su uso es cada vez
mayor.
En este punto la ayuda que la Estadística puede prestar al investigador es menor que en
el punto anterior; ya que es el investigador el que debe definir la población o universo de
estudio señalando los criterios de inclusión y de exclusión. Si el universo es muy grande
para ser estudiado en su totalidad, entonces el estudio se realizará a través de una
muestra. Esta actividad, es decir el muestreo, es típicamente estadística.
Formulación de hipótesis.
Procedimientos de medición.
Procedimientos de captación.
En este paso el concurso de la Estadística es necesario, ya que nos indicará cuál o cuáles
son los procedimientos útiles para la obtención de datos, además puede determinar la
validez y confiabilidad de los instrumentos de medición.
Esta etapa es típicamente estadística. Le permite al investigador una vez obtenido los
datos procesarlos y analizarlos estadísticamente. Aquí habitualmente se hace uso de la
Estadística Descriptiva y de la Inferencia si se trabaja con una muestra probabilística.
1º Que los datos ya hayan sido obtenidos de las unidades de observación y que estén
publicados o registrados en alguna fuente. Estos datos utilizados para el estudio
reciben el nombre de datos secundarios.
2º Que los datos se tengan que obtener directamente de las unidades de observación.
Estos datos reciben el nombre de datos primarios.
b. Observación: Una persona observa al elemento en estudio y registra los datos que se
van produciendo.
En los tres casos para recoger la información se utiliza un documento que contiene un
arreglo de enunciados y espacios para hacer anotaciones que se denomina formulario.
Diseño de formularios.
Otros puntos que deben ser considerados en opinión de Aburto [Aburto, C. 1978: 38,
siguientes] son:
Preguntas como: "¿Hasta qué año llegó usted en la escuela?" Permiten respuestas
como "Hasta tercero" y, sin embargo, resultaría perfectamente posible que la persona
no sepa nada de los que se supone que debe estudiarse en el tercer año, sencillamente
porque sólo asistió una semana, por ejemplo. En una situación como ésta resulta de
mayor utilidad el preguntar: “¿Cuál fue el último año que aprobó en la escuela?”.
interpretación que le dé el informante; una de ellas podrá ser “En una oficina” y ello
podrá significar en la oficina de una fábrica, de un centro comercial o del gobierno, y
si el interés se centraba en la rama de actividad la respuesta no resulta útil y menos
todavía si lo que se quería averiguar era la posición en el trabajo.
b. El vocabulario utilizado
Toda actividad humana llega a generar cierto vocabulario que en ocasiones resulta
muy específico y que, cuando no lo es, normalmente tiene diferente significado en
otras actividades. Esto es olvidado con frecuencia por el investigador y, por
consiguiente, para evitar omisiones de respuestas o errores de interpretación, debe
tomarse en cuenta la familiaridad que pueda tener con la terminología utilizada el
personal que vaya a captar la información, así como el elemento objeto de estudio,
substituyendo, cuando se considere necesario, términos como anorexia en lugar de
falta de apetito, cefalea en lugar de dolor de cabeza, etc.
Resulta conveniente, tanto para la precisión de las respuestas como para la rapidez
con que se proporcionen, el que las preguntas no se formulen agrupadas por afinidad
de las cuestiones tratadas y que dentro de cada grupo no exista un orden
determinado, pues al informante le desconcierta el que con cierto tipo de preguntas se
le haya llevado a considerar una determinada situación, para que después se le cambie
bruscamente a otra y posteriormente se le haga volver a una que ya había sido
manejada previamente.
e. Respuestas posibles
f. Prueba de formulario
Finalmente, el formulario debe ser probado en condiciones tan semejantes como sea
posible a la captación definitiva de los datos, para averiguar qué preguntas crean
confusión, redactarlas nuevamente, acudir al terreno otra vez y sólo cuando resulten
satisfactorias hacer la impresión definitiva.
Estructuradas
1. Sí [ ] 2. No [ ]
10
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
b. De opciones múltiples
1. Solo [ ] 2. Pareja [ ]
3. Hijo [ ] 4. Madre [ ]
5. Padre [ ] 6. Suegra [ ]
7. Otros [ ] ...........................................
c. Escala de valores
Este tipo de preguntas se emplean con frecuencia para determinar las opiniones o
actitudes acerca de un problema, una idea o un producto.
Me disgusta Me gusta
mucho mucho
_|____|____|____|____|____|____|____|____|____|____|_
-10 -8 -6 -4 -2 0 2 4 6 8 10
1. Malo [ ] 2. Regular [ ]
3. Bueno [ ] 4. Optimo [ ]
d. Escalas de clasificación
Escala que clasifica a los atributos desde “excelente” hasta “deficiente” o viceversa.
11
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
1. Excelente [ ]
2. Muy buena [ ]
3. Buena [ ]
4. Regular [ ]
5. Deficiente [ ]
e. Escala de importancia
1. Muy importante [ ]
2. Importante [ ]
3. Poco importante [ ]
4. Nada importante [ ]
f. Escala de likert
Ejemplo: ¿Los Hostales prestan un mejor servicio que los grandes Hoteles?
1. Fuerte discrepancia [ ]
2. Discrepancia [ ]
3. Ni de acuerdo ni discrepancia [ ]
4. Acuerdo [ ]
5. Fuerte acuerdo [ ]
g. Preguntas de control
respuestas de tal forma que se pueda dar valor a la investigación que se esta
realizando.
1. En la radio;
2. En la televisión;
3. En periódicos;
4. En afiches;
Inestructuradas
a. Asociación de palabras
Ejemplo: ¿Cuál es la primera palabra que se le viene a la mente cuando escucha las
siguientes frases o palabras?
Calmante: _________________________________________
Sunat: _____________________________________________
Detergente: ________________________________________
b. Terminación de relatos
c. Pregunta abierta
Se utiliza con frecuencia para determinar interés, motivaciones, etc. Este tipo de
preguntas por la complejidad que pueden tener las respuestas debe ser analizado
cuidadosamente por investigadores bien entrenados.
d. Formación de frases
e. Terminación de figuras
Se presenta a los encuestados una figura (dibujo) de dos personas, en donde una de
las cuales hace una afirmación acerca de algo, se pide a los investigados que se
identifiquen con una de ellas y que completen el parlamento que falta.
Se presenta un dibujo o una fotografía a los interrogados luego se les pide que
inventen un relato sobre lo que piensan que está ocurriendo o puede ocurrir en la
escena representada.
Organización de Datos.
Una vez que se ha captado o recopilado la información de cada uno de los elementos del
conjunto en estudio, esta tiene que ser revisada, clasificada, presentada y resumida para
permitir su análisis e interpretación, este conjunto de actividades corresponde a la
organización de datos. También se le denomina elaboración de datos.
Revisión de Datos.
14
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
15
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
DEFINICIÓN DE ESTADÍSTICA
Definición 1.- La Estadística es una disciplina científica, que tiene un objetivo
fundamental, que es el de hacer una inferencia optima; el juicio que se está haciendo de
ella debe ser del menor error posible.
Ejemplo: Interés: Determinar si existe relación entre el Control del Capital Intelectual y
el Cumplimiento de funciones en el Sistema Administrativo de la UNASAM
Sin embargo, el propósito del estudio es conocer algo sobre el cumplimiento de funciones
en la población y no tener conocimiento sobre el valor puntual en la muestra, en este caso
tenemos que recurrir a la inferencia estadística de modo que podamos pasar de la
muestra hacia la población. A continuación damos a conocer la definición de algunos
términos estadísticos:
16
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
unidad indivisible que es objeto de estudio, del cual se obtiene el dato estadístico.
Ejemplo: puede ser una persona, vivienda, animal, factura, etc.
Marco de muestreo.- Permite identificar a los elementos de la población y que puede ser
una lista de personas, una relación de viviendas, un archivo, un mapa de una
determinada comunidad, etc. El marco debe estar completamente actualizado porque de
él se seleccionará la muestra.
Estimador.- Es una medida de resumen que nos describe alguna característica de interés
en la muestra y cuyo valor es calculado usando sólo los valores de los elementos de una
muestra. Algunos estimadores conocidos y más usados son:
- Media muestral denotada por x
Ejemplo:
17
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
Variable.- Las variables son características de las personas u objetos que pueden tomar
diferentes valores. Ejemplo: peso, edad, sexo, número de hijos por familia, etc.
Ejemplo.-
2) Secundaria 3) Superior
Tipos de variable:
18
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
Este tipo de variable indica la presencia o ausencia de una cualidad o atributo. Estas
variables pueden ser dicotómicas si solamente tienen dos categorías mutuamente
excluyentes.
Ejemplo:
Ejemplo:
2. Variables cuantitativas.
Ejemplo:
- Peso
- Talla
Toma valores aislados y no puede tomar un valor entre dos consecutivos. Resultan
por lo general de un proceso de conteo. Ejemplo: Número de hijos por familia,
19
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
Cuando toma cualquier número real, es decir, entre dos valores consecutivos
siempre encontraremos infinitos valores. Resultan por lo general de un proceso de
medición. Por ejemplo: peso, talla, perímetro cefálico, hemoglobina, presión
arterial, ingreso económico, etc.
1. Nominal: Para cada unidad de estudio se determina la pertenencia a una entre varias
categorías. Las categorías son mutuamente excluyentes y exhaustivas, y no es posible
establecer relaciones de orden entre las categorías. Por ejemplo las variables estado
civil, sexo, procedencia, se miden en escala nominal.
20
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
21
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
DISTRIBUCIÓN DE FRECUENCIAS
OBTENCIÓN Y PRESENTACIÓN DE DATOS:
OBTENCIÓN DE DATOS:
Partes Principales de una tabla Estadística.- Las partes principales de toda tabla
estadística son tres y éstas son: Encabezamiento, Cuerpo y Pié de tabla:
3. Pié de tabla: También conocido como fuente, que sirve para anotar de donde y/o
cómo se obtuvo la información que se está presentando.
22
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
3. Frecuencia Relativa simple : Se representa por hi con (i= 1,2,..., k), y está dado
por :
ni
hi % = *100
n
23
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
N j = n1 + n2 + n3 + ... + n j
j
Nj
i1
ni
Es decir:
Nj
H j %= *100
n
Como se vio anteriormente, variable discreta es aquella cuyo valor se expresa sólo
por números enteros positivos.
Ejemplo: Se realiza una encuesta a ciertos Centros de Salud del área rural de Huaraz
para ver el Nº de trabajadores que laboran en un turno determinado, obteniéndose la
siguiente información:
7; 4; 6; 7; 10; 4; 5; 6; 7; 10; 6; 4; 5; 6; 8;
10; 8; 12; 7; 6; 8; 12; 5; 5; 10; 4; 5; 8; 10; 4.
24
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
Interpretación:
Tabulación: Repite cada valor de Xi, es decir cuantos Centros de Salud hay en cada
una de las 8 categorías.
Nº Nº de Centros de
trabajadore Salud Nº Acumulado de C.
s Salud
Frec. Frec. Frec. Frec.
Tabulación Absoluta Relativ Absoluta Relativas
Simple a acumulada acumulad
Xi ni Simple s as Hi%
hi% Ni
4 IIIII 5 16,7 5 16,7
5 IIIII 5 16,7 10 33,3
6 IIIII 5 16,7 15 50,0
7 IIII 4 13,3 19 63,3
8 IIII 4 13,3 23 76,7
9 0 00,0 23 76,7
10 IIIII 5 16,7 28 93,3
11 0 00,0 28 93,3
12 II 2 06,7 30 100,0
TOTAL 30 100,0
25
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
Como se vio anteriormente, una variable continua es aquella que puede tomar
cualquier valor del conjunto de los números reales.
R = Xmáximo – Xmínimo
2. Valor de la Variable o Intervalo de Clase Se representa por Y’i a los límites de los
intervalos de clase que resultan de la clasificación de la variable.
Ic = 1 + 3,322 log(n)
Rango R
c = -------------------- = ----
nº de intervalos Ic
5. Formar los intervalos de clase; definidos los intervalos cada uno de ellos se
denota por:
Yi ''1 Yi '
Yi=
2
16 10 14 10 18 08 09 16 06 12
05 06 15 18 15 13 01 13 03 04
12 12 16 17 19 04 17 02 10 11
18 15 11 20 11 09 10 18 11 10
10 14 19 19 06 13 12 19 14 16
Como las notas varían de 01 a 20, trataremos a esta variable como si fuera continua y
agruparemos las notas en intervalos. Los intervalos se acostumbran a construir de la
forma “semi abierto”, es decir [........ Para este ejemplo consideraremos 5 intervalos
de igual amplitud. Por criterio del investigador no utilizamos la regla de Sturges.
En consecuencia los intervalos serán: [01 - 05. [05 - 09. [09 - 13. [13 - 17. [17 -
21. Como es evidente en el último intervalo se considera como límite superior un
valor que no existe, esto es usual en el primer y último intervalo de cualquier tabla.
A continuación la tabla.
27
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
[01 - 05 3 5 10 5 10
[05 - 09 7 5 10 10 20
[09 - 13 11 16 32 26 52
[13 - 17 15 13 26 39 78
Interpretaciones:
a) Las tablas no deben ser complicadas, ni grandes ni largas; tienen que ser precisos y
claros.
b) Si se tiene más de dos variables, éstas deben estar relacionadas entre sí.
b) Las categorías consideradas en la tabla deben de estar arregladas de tal modo que se
facilite el análisis y las comparaciones. Por ejemplo:
28
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
TABLA Nº 01
TABLA Nº 12
29
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
GRÁFICOS ESTADÍSTICOS:
2. DIAGRAMA: está dado por el propio dibujo de gráfico, y como en el cuerpo del
cuadro, están representados los datos indicados en el título.
4. FUENTE: Se usa generalmente para designar la tabla de donde provienen los datos
graficados.
Al igual que las tablas, los gráficos que sirven para describir datos, son muchísimos y
quedan a la mejor inspiración del interesado con la sola condición de que el gráfico a
simple vista descubre el mayor número de detalles que posee.
30
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
Barras
Circulares
Bastones
Circulares
Mayor entero.
Histogramas
Polígonos
Circulares
Ojivas
Escalones
Areas
Tronco y hojas
Cajas
31
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
* Notación de Sumatoria
3
Ejemplo 1: Escribir los términos de X i 1
i . Esta expresión se lee: "sumatoria de los
elementos de la forma Xi, donde i varía desde 1 hasta 3" y su desarrollo es:
3
i 1
Xi X1 X 2 X 3
3
Ejemplo 2: Escribir los términos de
i 1
X i n i . Esta expresión se lee: "sumatoria de los
elementos de la forma Xi por fi, donde i varía desde 1 hasta 4" y su desarrollo es:
4
X in i
i 1
X 1n1 X 2n2 X 3n3 X 4n4
Ejemplo 3: Si X1 = 3, X2 = 8, X3 = 4, X4 = 3. n1 = 2, n2 = 7, n3 = 1, n4 = 2, calcular:
4 4
a)
i 1
Xi b)
i 1
Xi n i
4
a)
i 1
Xi = 3 + 8 + 4 + 3 = 18
4
b) X ini = (3)(2) + (8)(7) + (4)(1) + (3)(2)
i 1
= 6 + 56 + 4 + 6 = 72
32
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
MEDIA ARITMETICA
Es el estadígrafo más conocido, el más fácil de calcular, es muy sensible a los valores
extremos cuando estos son demasiado bajos o altos. Su notación es:
x, M , M, M[x], E[x], μ .
1
La media Aritmética se define como la suma de todos los valores observados dividido
por el número de observaciones (n).
X
x i
x1 = 1; x2 = 3; x3 = 2; x4 = 5; x5 = 4
x6 = 2; x7 = 4; x8 = 0; x9 = 1, x10 = 3
Solución:
x i 49
X= = = 2,45
n 20
Ejemplo 5: Supongamos que en una agencia de Telefónica hay cinco ventanillas para
recibir reclamos de los abonados y que durante una semana se observó el número de
reclamos presentados en cada ventanilla obteniéndose los resultados siguientes:
33
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
Ventanilla N° 1 2 3 4 5
N° de reclamos 45 43 25 17 30
La media es:
45 43 25 17 30 160
X 32
5 5
Notamos que:
Ejemplo 6: Por ejemplo si las notas de un alumno en un curso son: 13; 16; 11; 08; 14 y
10 para hallar la media aritmética de sus notas procederemos de la siguiente manera:
13 16 11 08 14 10 72
X 12
6 6
Si los datos están agrupados en una tabla de frecuencias, primero se multiplican los
valores de la variable por sus respectivas frecuencias, luego se suman estos productos
y por último se divide el resultado entre el número de datos.
34
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
Xi ni Xi x n i
23 3 69
24 6 144
25 9 225
26 5 130
27 2 54
622
La edad promedio es: X 24,88
25
X .n
i 1
i i
X
n
yi * n i
Y=
n
y 1 . n 1 + y 2 . n 2 + ... + y m . n m
Y=
n
Ejemplo 8: Para los datos del Ejemplo 4, calcule la media aritmética si los datos se
presentan en la siguiente tabla:
35
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
TABLA Nº 1
yi ni yi.ni
0 2 0
1 4 4
2 5 10
3 3 9
4 4 16
5 2 10
20 49
yi n i 49
y= = = 2,45
n 20
TABLA N° 2
Peso (Kg)
47 - 55 51 8 408
55 - 63 59 5 295
63 - 71 67 4 268
71 - 79 75 6 450
79 - 87 83 8 664
87 -95 91 4 364
36
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
Y
y i .n i
2449
69,971
n 35
Esto es, el peso medio de los 35 alumnos es de 69 kilos con 971 gramos.
TABLA N° 3
.
[y'i-1 - y'i) yi .ni .yi.ni
46 - 54 50 2 100
54 - 62 58 4 232
62 - 70 66 5 330
70 - 78 74 4 296
78 - 86 82 3 246
86 - 94 90 2 180
Total - 20 1 384
1384
Y 69,2
20
Esto es, la edad media de los pacientes con problemas prostáticos es de 69,2 años. (69
años con 73 días)
Sabiendo que:
ni
hi =
n
Se tiene:
Y = yi . hi
37
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
Y y1 .h1 y 2 .h 2 y 3 .h 3 y k .h k
Ejemplo 11: Para la información del ejemplo 5, encuentre la media aritmética usando las
frecuencias relativas:
TABLA N° 4
yi hi yi .hi
50 0,10 5,00
58 0,20 11,60
66 0,25 16,50
74 0,20 14,80
82 0,15 12,30
90 0,10 9,00
1,00 69,20
Y = 69,20
Ejemplo 12: En un colegio se cuenta con dos secciones de primer grado de secundaria, si
la sección A que cuenta con 42 alumnos obtuvo una nota promedio de 15,6 en una
prueba bimestral y la sección B de 53 alumnos obtuvo 12,6 en la misma prueba, ¿Cuál
será el promedio del total de los alumnos de primer grado?
Para resolver este problema debemos calcular la media aritmética de la siguiente manera:
(42)(15,6) (53)(12,6)
X
42 53
655,2 667,8
X
95
1323
X 13,93
95
38
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
n 1.X1 n 2 .X 2
X
n 1 n2
VENTAJAS:
a. La media aritmética es, la medida más fácil de entender y la más comúnmente usada.
Es un valor tal, que si se calculara para un grupo en el cual todos los elementos
fueran iguales, cada uno de ellos sería igual a su media aritmética, de donde
podemos deducir que la media aritmética de n elementos es un nuevo elemento
formado tomando una parte igual a 1/n de cada uno de los elementos originales.
b. Esta medida se define en forma rígida por una ecuación matemática muy fácil de
entender y algunas veces, se puede obtener cuando no es posible calcular otros tipos
de medidas de tendencia central y aun en el caso de no conocer los valores
individuales de la serie de datos.
e. Como una ventaja final de la media aritmética, podemos anotar el hecho de que es
excepcionalmente adaptable cuando se trata de hacer cálculos matemáticos
posteriores con él (promedio ponderado, métodos abreviados, promedio de
promedios).
DESVENTAJAS:
a. Es muy sensible a los valores muy grandes o muy pequeños (valores extremos),
especialmente a los primeros y a la inclusión de tales datos extremos en la
distribución que se esté estudiando, puede dar un promedio aritmético que no sea
39
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
LA MEDIANA
En una ordenación creciente de los valores observados la Mediana es el valor que ocupa
la posición central (si n es impar) o es la semisuma de los dos valores centrales (si n es
n 1
par). La mediana se encuentra ubicada en la posición ( ) avo lugar, esto es en datos
2
discretos.
La mediana es el dato central 2; esto es Me[X] =2; mientras que para los valores 2, 5, 7, 6,
4, 8 la ordenación creciente es 2, 4, 5, 6, 7, 8
40
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
n
N i 1
M e [Y] y i' 1 C 2
ni
TABLA N° 8
Peso (Kg)
[y'i-1 - y'i) .yi .ni Ni
47 - 55 51 8 8
55 - 63 59 5 13
63 - 71 67 4 17
71 - 79 75 6 23
79 - 87 83 8 31
87 -95 91 4 35
TOTAL ---- 35 ---
41
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
17,5 17
M e [Y] 71 8 71 0,667 71,667
6
Características de la mediana:
c. La mediana es un valor o valor potencial que divide al arreglo creciente de los datos
de modo que hay igual número de ellos por debajo y por encima de la mediana.
VENTAJAS:
a. La mediana tiene una definición rígida y el concepto que envuelve es tan claro que
cualquiera puede entenderlo aun no siendo familiar el término.
c. Tiene menos estabilidad en el muestreo que la media aritmética, pero es más estable
que otras medidas.
d. Hay situaciones en que la única medida de tendencia central que puede calcularse es
la mediana, tal como sucede en el caso de una distribución cuyos intervalos extremos
no están definidos.
42
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
DESVENTAJAS:
LA MODA
Llamada también modo o valor modal se simboliza por Mo y se define como aquel valor
de la variable que presenta la mayor frecuencia.
Es la medida de posición más fácil de determinar pues sólo se requiere inspección del
conjunto de datos originales y no-cálculo; pero tiene la desventaja de que no siempre
existe(caso de distribución uniforme o todos los valores diferentes con igual frecuencia) o
puede haber dos o más valores con la frecuencia mayor. Por otro lado, el valor de la
moda podría ubicarla cerca de alguno de los extremos de la distribución y entonces no
sería una posición central. Por todo esto la moda no es una media muy utilizada;
solamente se usa cuando se requiere una aproximación rápida a la medida de posición.
Calculo de la moda:
43
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
TABLA Nº 9
.xi .ni
0 8
1 12
2 30
3 20
4 10
80
M o [X] 2
D1
M o [Y] y 'i 1 C
D1 D2
Donde:
Di = ni - ni - 1
D2 = ni - ni + 1
Ejemplo 15: Encontrar la moda, haciendo uso de los datos de la siguiente tabla.
44
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
TABLA Nº 10
6 - 16 11 6
16 - 26 21 14
26 - 36 31 22 ni –1
36 - 46 41 38 ni
46 - 56 51 26 ni +1
56 - 66 61 14
66 - 76 71 10
Total -- 130
D1 = 38 - 22 = 16; D2 = 38 - 26 = 12
Por lo tanto:
16
M o [Y] 36 10 41,714
16 12
VENTAJAS:
a. El hecho de que la moda indica el punto de mayor concentración, lo hace tal vez, la
mejor medida de tendencia central. Cuando una distribución es muy asimétrica,
claramente se ve que la moda es el más representativo del grupo, y en algunos casos,
si la moda y el promedio aritmético son significativamente diferentes del valor, es
preferible usar la moda.
DESVENTAJAS:
45
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
M a X
n
Fórmula para datos discretos
1
x
i
M a Y
n
Fórmula para datos agrupados k
ni
i 1 y i
d. Cuando la distribución tenga forma de U es decir que pueda representarse por una
curva cóncava de extremos iguales, debe usarse la moda.
46
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
g. Cuando haya alguna razón para pensar que el promedio aritmético no representa
muy bien a la distribución debido a que valores extremos lo afectan, o por otras
razones debe considerarse la posibilidad de usar la mediana y la moda.
47
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
Ejemplos Resueltos:
1º. Con los datos obtenidos sobre el número de hijos por familia, se pide calcular la
media aritmética, la mediana y la moda.
Xi ni Xini Ni
0 2 0 2
2 3 6 5
4 7 28 12
6 4 24 16
7 4 28 20
Total 20 86 -
Solución:
a. Media aritmética
86
M 4,3
20
Me = 4
MO = 4
2º. Con los datos, referente a una distribución asimétrica, se pide calcular la Media
aritmética, la Mediana y la moda.
Total -- 50 296,50 -
48
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
Solución:
a. Media aritmética
296,50
Y 5,93
50
b. La mediana (n/2) = 25
25 20
Me 5,75 1,5 6,05
25
c. La moda:
ni = 25; ni - 1 = 16; ni + 1 = 5
Entonces D1 = 25 - 16 = 9
D2 = 25 - 5 = 20
9
Mo 5,75 1,5 6,2155
29
Solución:
n1 = 75 X1 = 52,6
n2 = 25 X 2 = 48,4
X = ?
52,6(75) 48,4(25)
X 51,55
100
49
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
Solución:
n = 45 X = 55
n1 = 20 X1= 48,4
n2 = 25 X 2 = ?
55 = 48,4(20) + X 2(25)
45
2,475 = 968 + 25X 2
X 2 = 60,28
Solución:
n = 91 X = 69,3
nA = nB X A = 70,40
nC = nA - 5 X B = 64,20
X C = ?
nA + nB+ nC = 91
nA = 96/3 = 32 nB = 32 nC = 27
X C = 1 999,1 = 74,04
27
50
____________________________________________________________
Facultad de Ciencias – UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López
6º. Se sabe que ninguna de las sucursales de una empresa comercial tiene más de 9
empleados o menos de 7. La mayoría tiene 8 empleados, pero el 25% tiene 9
empleados y una de cada 10 sucursales tiene 7 empleados. ¿Cuál es el promedio de
empleados por sucursal?
Yi hi Yihi
7 0,10 0,70
8 0,65 5,20
9 0,25 2,25
Solución:
Y =Yihi = 8,15
51
____________________________________________________________
Facultad de Ciencias – UNASAM