Introducción A La Estadística Descriptiva PDF
Introducción A La Estadística Descriptiva PDF
Introducción A La Estadística Descriptiva PDF
1
Introducción a la
Estadística Descriptiva
Introducción a la
Estadística Descriptiva
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
Mesa Guerrero, Javier Alberto
Introducción a la estadística descriptiva / Javier Alberto Mesa Guerrero,
Segundo Javier Caicedo Zambrano. San Juan de Pasto : Editorial Universidad de
Nariño, 2020
123 p.
Incluye bibliografía
ISBN: 978-958-5123-11-3 digital
1. Estadística descriptiva 2. Variables (estadística) 3. Estadística – problemas,
ejercicios, etc. 4. Estadística - enseñanza I. Caicedo Zambrano, Segundo Javier
519.53 M578 – SCDD-Ed. 22 Biblioteca Alberto Quijano Guerrero
índice de Contenido
INTRODUCCIÓN.......................................................... 10
CAPÍTULO 1.
CONCEPTOS BÁSICOS................................................ 12
1.1GENERALIDADES........................................................................... 12
1.1.1 Estadística Descriptiva.............................................................................. 12
1.1.2 Estadística Inferencial............................................................................... 12
1.1.3 Variables.................................................................................................... 13
1.1.4 Escalas de medición.................................................................................. 13
1.1.5 Población.................................................................................................. 14
1.1.6 Etapas de la investigación estadística....................................................... 14
1.1.6.1 Primera etapa: planeación................................................................ 14
1.1.6.2 Segunda etapa: ejecución................................................................. 15
1.1.6.3 Tercera etapa: evaluación................................................................ 15
1.2 ORGANIZACIÓN DE DATOS....................................................... 15
1.2.1 Serie estadística........................................................................................ 15
1.2.1.1 Atemporales..................................................................................... 15
1.2.1.2 Temporales o cronológicas.............................................................. 16
1.2.2 Distribución de frecuencias...................................................................... 19
1.2.2.1 Distribución de frecuencias para variable discreta......................... 19
1.2.2.2 Distribución de frecuencias para variable continua........................ 23
1.2.2.3 Representación gráfica de una distribución de frecuencias............ 25
1.3 TALLER............................................................................................. 28
7
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
CAPÍTULO 2.
MEDIDAS ESTADÍSTICAS........................................... 30
2.1 MEDIDAS DE TENDENCIA CENTRAL....................................... 30
2.1.1 Promedio aritmético................................................................................ 30
2.1.1.1 Propiedades de la media aritmética................................................ 32
2.1.1.2 Método abreviado para calcular el promedio aritmético............... 34
2.1.1.3 Promedio aritmético ponderado..................................................... 35
2.1.2 Mediana.................................................................................................... 36
2.1.2.1 Cálculo de la mediana en datos agrupados
para una variable discreta.........................................................................37
2.1.2.2 Cálculo de la mediana para datos agrupados en intervalos........... 38
2.1.3 Media geométrica .................................................................................... 40
2.1.4 Media armónica........................................................................................ 43
2.1.4.1 Cálculo en datos no agrupados....................................................... 44
2.1.4.2 Cálculo en datos agrupados............................................................ 44
2.1.5 Moda......................................................................................................... 45
2.1.5.1 Cálculo en datos agrupados............................................................ 45
2.2 MEDIDAS DE POSICIÓN............................................................... 46
2.2.1 Cuartiles................................................................................................... 46
2.2.2 Deciles...................................................................................................... 47
2.2.3 Percentiles................................................................................................. 47
2.2.4 Rango percentil........................................................................................ 49
2.3 MEDIDAS DE VARIABILIDAD...................................................... 49
2.3.1 Recorrido o rango.................................................................................... 49
2.3.2 Desviación media..................................................................................... 50
2.3.2.1 Cálculo de la desviación media en datos NO agrupados.............. 50
2.3.2.2 Cálculo de la desviación media en datos agrupados...................... 50
2.3.3 Varianza.................................................................................................... 51
2.3.3.1 Cálculo de varianza en datos no agrupados................................... 51
8
Introducción a la Estadística Descriptiva
CAPÍTULO 3.
REGRESIÓN Y CORRELACIÓN.................................. 60
3.1 COEFICIENTE DE CORRELACIÓN............................................. 61
3.2 REGRESIÓN LINEAL...................................................................... 63
3.3 REGRESIÓN NO LINEAL.............................................................. 67
3.3.1 Función potencial .................................................................................... 67
3.3.2. Función exponencial................................................................................ 69
3.3.3 Función cuadrática.................................................................................... 71
CAPÍTULO 4.
SERIES CRONOLÓGICAS............................................ 75
4.1 ANÁLISIS DE SERIES CRONOLÓGICAS.................................... 75
4.2 ECUACIÓN DE TENDENCIA....................................................... 77
4.3 TALLER............................................................................................. 78
9
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
INTRODUCCIÓN
Esta obra surge por el interés de los autores de publicar un libro de texto a nivel
introductorio sobre fundamentos de estadística descriptiva, que se constituya en
fuente de consulta y de nivelación sobre conceptos básicos de estadística. Por el
enfoque, está orientado a estudiantes de los primeros semestres de programas
universitarios relacionados con las Ciencias Básicas, Técnicas e Ingenierías, aunque
también lo pueden utilizar estudiantes de otras áreas del conocimiento, incluso de
programas de educación no formal.
Los temas que se abordan en esta obra, han sido seleccionados con base en la
experiencia de los autores, quienes reconocen que se constituye en soporte impor-
tante para estudiantes que inician el estudio de la estadística. Para el efecto, se pre-
senta, en forma resumida, la conceptualización, ejemplos y se proponen ejercicios
para reforzar lo aprendido. Si bien existen muchos programas para el cálculo de
estadísticas, los autores consideran que es importante que los estudiantes realicen
los cálculos paso a paso, tal como se ilustra en los ejemplos, porque ayuda para la
comprensión e interpretación de los resultados.
El libro está organizado en cuatro (4) capítulos. El primero, “Conceptos Básicos”,
presenta generalidades de estadística y organización de datos en tablas de frecuen-
cia. En el segundo capítulo, “Medidas estadísticas”, se trabaja las medidas de ten-
dencia central, medidas de posición, medidas de variabilidad, momentos, relación
y correlación simple, y análisis de series cronológicas. En el tercer capítulo, “Regre-
sión y correlación”, se incluye coeficiente de correlación, regresión lineal, regresión
no lineal: función potencial, función exponencial y función cuadrática. En el cuarto
capítulo, “Series cronológicas”, se aborda el análisis de estas series.
Se sugiere que el estudio del libro se realice en forma secuencial y se desarrollen to-
dos los talleres que se proponen, con lo cual, el estudiante avanzará seguro y tendrá
la posibilidad de finalizar su estudio con una sólida comprensión de los conceptos
básicos de estadística descriptiva.
Los autores, Marzo 2020
10
Introducción a la Estadística Descriptiva
11
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
CAPÍTULO 1.
CONCEPTOS BÁSICOS
1.1GENERALIDADES
En términos generales, se considera que la finalidad de la Estadística es suministrar
información acerca de un determinado hecho o fenómeno; su utilidad depende, en
gran parte, de los fines que se propone y de la forma cómo se obtienen los datos.
Por medio de la Estadística se puede lograr los siguientes propósitos:
Conocer la realidad de una observación. Si mediante la investigación se logra
CUANTIFICAR un fenómeno, se conoce la situación real o una estimación del
mismo.
Determinar lo típico o normal de las observaciones. Cuando se cuantifican las ca-
racterísticas de un fenómeno, se está determinando el comportamiento general del
grupo, el grado de uniformidad o variabilidad, la asimetría y el tipo de distribución
de la variable.
Estimar y proyectar el comportamiento futuro de un hecho observado.
Determinar las causas que originan un fenómeno.
Comprobar hipótesis planteadas en una investigación.
Cruzar dos o más variables con el fin de conocer el grado de relación existente
entre ellas y determinar la ecuación que las relaciona.
Hacer inferencias basándose en resultados muestrales y en las leyes del Cálculo
de Probabilidades. Teniendo en cuenta que la Estadística estudia los fenómenos
colectivos, es necesario conocer ciertas técnicas que permitan agrupar la informa-
ción con el fin de facilitar el procesamiento, presentación, análisis y publicación de
resultados.
Dependiendo de si el estudio se realiza con base en una muestra o en una pobla-
ción, la Estadística se clasifique en Descriptiva e Inferencial, respectivamente.
1.1.3 Variables
Las variables son las características de la muestra o población que se está estudiando y
los datos son los valores de las variables; corresponden a los resultados de la medición.
Ejemplo:
La variable salarios de los trabajadores de una empresa, se mide en pesos.
Ejemplo:
La vida útil de un artículo en días. La diferencia entre 500 y 250 días indica que la
duración del primero es el doble del segundo,
1.1.5 Población
Se define la estadística como “La tecnología del método científico”; por lo cual,
constituye una herramienta muy importante en la investigación.
Como producto de esta etapa, se debe elaborar un documento que contenga los
siguientes aspectos:
• Formulación del problema.
• Fijación de objetivos, marco teórico y justificación.
• Planteamiento de hipótesis.
• Revisión bibliográfica.
• Metodología de la investigación (definiciones de población, muestra,
unidad, diseño muestral, diseño de instrumentos, planes de recolec-
ción, recursos, etc.).
14
Introducción a la Estadística Descriptiva
• Cronograma de actividades.
• Presupuesto
1.2.1.1 Atemporales
15
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
En las series cuantitativas los datos se clasifican de acuerdo a una magnitud o medi-
ción; según la naturaleza de la variable pueden ser discretas o continuas. Es en este
tipo de series es donde se puede aplicar la mayoría de técnicas estadísticas, hacien-
do un análisis individual de cada una de las variables o cruzando dos o más de ellas,
con el fin de realizar un estudio conjunto de las mismas.
Suponga que después de recolectar la información para un estudio acerca del rendi-
miento académico y las carreras preferidas por 30 estudiantes de los colegios de la
ciudad de Pasto, se obtuvo la siguiente información:
Tabla 1. Ejemplo de Rendimiento académico y selección de carrera de un grupo de estu-
diantes
16
Introducción a la Estadística Descriptiva
Fuente: elaboración propia con datos hipotéticos de 30 estudiantes que aspiran ingresar a la Universidad de Nariño
17
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
18
Introducción a la Estadística Descriptiva
Jornada
Género % Total
Diurno % Nocturno
M 9 30,00% 5 16,70% 14
F 11 36,70% 5 16,70% 16
Una vez producidos o recolectados los datos de un estudio se organizan en tablas, deno-
minadas distribuciones de frecuencia.
Si los resultados de las observaciones toman valores enteros únicamente, se trata de va-
riables discretas. Los resultados según el orden en que se presenten se pueden simbolizar
por ; es probable que muchos datos se repitan. Para ordenar los datos en una distribución
de frecuencias, se designa por al mínimo de los ; al siguiente, y así sucesivamente, hasta
llegar al máximo, haciendo corresponder cada dato con el número de veces que aparece
(), como se muestra en la tabla 5.
19
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
Ejemplo:
Construir una distribución de frecuencias con los datos hipotéticos de inasistencia a clases
de un grupo escolar, relacionados en el cuadro 1:
Cuadro 1. Datos hipotéticos de inasistencia a clases de un grupo de estudiantes
2 3 4 0 3 3 3 1 2 3
2 1 2 3 2 3 3 5 5 4
2 4 1 6 1 6 4 0 5 3
3 3 1 1 6 0 3 3 4 4
3 2 3 2 4 4 2 5 2 1
Cada uno de los datos, , de la tabla anterior, son los resultados del control de asisten-
cia de un grupo de estudiantes durante un año escolar. Con los datos suministrados se ha
construido la distribución de frecuencias de la tabla 7.
Tabla 7. Distribución de frecuencias con los datos de inasistencia a clases de un grupo escolar
representados en el cuadro 1
Faltas
0 3 3 6% 6%
1 7 10 14% 20%
2 10 20 20% 40%
3 15 35 30% 70%
4 8 43 16% 86%
5 4 47 8% 94%
6 3 50 6% 100%
Total 50 100%
Frecuencias relativas
35%
30%
30%
25%
20%
20% 16%
14%
15%
10% 8%
6% 6%
5%
0%
0 1 2 3 4 5 6
Nº de faltas
120%
100%
94%
100% 86%
80% 70%
60%
40%
40%
20%
20% 6%
0%
0 1 2 3 4 5 6
Nº de faltas
22
Introducción a la Estadística Descriptiva
Cuando se trata de una variable continua, es necesario agrupar los datos en intervalos,
llamados categorías o clases, los cuales pueden tener igual o distinta amplitud; inclusive,
pueden existir intervalos semiabiertos. Por ejemplo:
A) Si se trata de medir rendimiento académico, independientemente del número
de estudiantes, se acostumbra a utilizar 5 grupos de igual amplitud que represen-
tan rendimiento: excelente, bueno, regular, malo y pésimo.
B) En estudios demográficos, en donde se considere la variable edad, los valores se
pueden organizar en intervalos de diferente amplitud, así: menores de 15 años, de
15 a 20, de 20 a 45 y de 45 años o más.
Es recomendable utilizar intervalos de igual amplitud con el fin de facilitar los cálculos esta-
dísticos.
Cuando una variable discreta toma valores muy dispersos, se sugiere organizar los datos en
intervalos, mediante una distribución de frecuencias, procediendo de la siguiente manera:
• Para muestras entre 100 y 1000 datos, pueden ser necesarios de 7 a 9 grupos.
• Para 1000 datos:
• Para muestras entre 1000 y 10000 datos se puede utilizar entre 10 y 13 grupos.
• Para 10000 datos:
23
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
5. Formar las clases, empezando con el dato mínimo y aumentar cada vez la ampli-
tud del intervalo.
Ejemplo:
Suponga que los puntajes que se presentan en el cuadro 2 corresponden a los resul-
tados obtenidos en una prueba de conocimientos, calificados en una escala de 100 a
400 puntos.
Cuadro 2. Datos hipotéticos de una prueba de conocimientos de 50 estudiantes calificados
en una escala de 100 a 400 puntos
190 190 192 198 200 200 203 205 208 208
209 214 219 220 225 225 226 227 227 227
230 230 230 230 235 240 240 245 246 247
250 260 267 268 275 278 280 280 295 296
297 300 310 330 331 332 333 335 338 338
Rango:
Número de grupos:
Amplitud:
Se observa que el valor 21,14 se aproxima al entero siguiente, porque si se redon-
dea al entero menor, es posible que en el último intervalo no queden incluidos todos
datos, requiriendo adicionar otro intervalo. Los grupos también se pueden escribir
como intervalos de la forma [, así: [190, 212).
24
Introducción a la Estadística Descriptiva
Tabla 8. Distribución de frecuencias con los datos hipotéticos de una prueba de conocimientos de
50 estudiantes, calificada en una escala de 100 a 400, representados en el cuadro 2.
La columna contiene las marcas de clase de cada intervalo y corresponde al valor que
representa los datos contenidos en cada intervalo, es decir, en cada grupo.
Para la aplicación de las fórmulas estadísticas en datos agrupados se utilizan las marcas
de clase, con el riesgo de que se pierda precisión en el resultado final, puesto que no se
trabaja con los datos originales. Si para la distribución de frecuencias se toma un número
adecuado de intervalos, las diferencias pueden no ser significativas.
La interpretación de los datos de la segunda fila, es la siguiente:
• 13 estudiantes obtuvieron un puntaje comprendido entre 212 y 233 puntos.
• El 26% de los estudiantes obtuvo un puntaje comprendido entre 212 y 233
puntos.
25
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
POLIGONO DE FRECUENCIAS
30%
25%
20%
15%
10%
5%
0%
178,5
200,5
222,5
244,5
266,5
288,5
310,5
332,5
354,5
MARCAS DE CLASE
Un gráfico que muestra las frecuencias acumuladas (menor que), se denomina polí-
gono de frecuencias acumuladas u Ojiva.
26
Introducción a la Estadística Descriptiva
120%
100%
100%
86%
82%
80%
70%
62%
60%
48%
40%
22%
20%
0
0%
190
212
234
256
278
300
322
Fuente: elaboración propia con los datos de la tabla 8
Se puede observar que el 22% de los estudiantes tiene un puntaje inferior a 212 puntos, lo
cual coincide con los datos de la tabla 9; de igual forma, el 82% tiene puntuaciones meno-
res que 300 puntos.
Del gráfico de una Ojiva ascendente, se puede determinar, de manera aproximada, cual-
quier porcentaje de alumnos que se ubique por debajo de un valor indicado o encontrar el
valor (percentil) por debajo del cual queda un determinado porcentaje (rango percentil).
Por ejemplo, el 50% de los estudiantes tienen puntajes inferiores a 243 puntos.
Ejemplo:
Las notas correspondientes al primer parcial de 44 estudiantes de Estadística Descriptiva
en el período A-2019, fueron las siguientes:
Cuadro 3. Notas hipotéticas del primer parcial de Estadística Descriptiva en el período A-2019 de
la Universidad de Nariño
Los intervalos utilizados son intervalos semiabiertos, de la siguiente forma: [. Por ejemplo,
en el intervalo se incluye las calificaciones mayores o iguales a cero y menores que uno.
27
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
Tabla 9. Notas parciales hipotéticas de Estadística Descriptiva del primer parcial de Esta-
dística Descriptiva en el período A-2019 de la Universidad de Nariño, representados en el
cuadro 3
1.3 TALLER
29
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
CAPÍTULO 2.
MEDIDAS ESTADÍSTICAS
Son valores que permiten conocer las características de una variable, también se co-
nocen con el nombre de estadígrafos; se destacan las medidas de tendencia central
o promedios, de posición, de variabilidad, de asimetría y curtosis.
Todas las medidas estadísticas aquí estudiadas, se pueden calcular de dos maneras:
a) Utilizando funciones estadísticas de Microsoft Excel: se trabaja directamente en la
base de datos, de lo cual se obtiene los resultados únicamente.
b) Aplicando fórmulas en las distribuciones de frecuencias: en este caso, se obtiene
los resultados de manera didáctica.
30
Introducción a la Estadística Descriptiva
c) Se desea conocer el promedio de una variable a través del tiempo; por ejemplo, costo
de vida, crecimiento de población, operaciones financieras.
Ejemplo:
Calcular el promedio de los puntajes de una prueba de conocimientos aplicada a 50 estu-
diantes, cuyos datos se presentan en el cuadro 4.
Cuadro 4. Puntajes hipotéticos de una prueba de conocimientos aplicada a 50 estudiantes en una
escala de 1 a 400
Grupos
Se puede observar que los promedios calculados con los datos NO agrupados y
con los mismos datos agrupados en clases, son aproximadamente iguales; pues,
si bien, en la agrupación se pueden producir diferencias, en general estas no son
importantes.
Ejemplo:
Suponga que los siguientes datos corresponden a las calificaciones de cinco estu-
diantes, evaluados en una escala de 1 a 10: 2, 4, 6, 8, 10.
El promedio de las calificaciones es:
2 -4
4 -2
6 0
8 2
10 4
Suma 0
32
Introducción a la Estadística Descriptiva
Tabla 12. Ejemplo de cálculo de desviación en datos agrupados respecto a la media con los datos
de la tabla 10
Grupos
3) El promedio del producto de una constante por una variable, es igual al producto de la
constante por el promedio de la variable:
Ejemplo:
En un curso de Estadística hay 60 estudiantes, de los cuales 20 son mujeres; la nota prome-
dio de los hombres es 4,0 y de las mujeres 3,5. Determinar la nota nota promedio de todo
el grupo.
33
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
El promedio del grupo se obtiene aplicando la fórmula para el cálculo del promedio
ponderado, así:
Se observa que el promedio ponderado es 3,83 puntos, un poco menos que el pro-
medio de los hombres, y a la vez, un poco más que el promedio de las mujeres.
Ejemplo:
Utilizando los datos de la tabla 10, sea ; determinar los valores de u:
34
Introducción a la Estadística Descriptiva
Tabla 13. Distribución de frecuencias para cálculo de promedio por método abreviado con los datos
de la tabla 10
Grupos
Hay casos en que los valores de una variable no tienen la misma importancia o peso, por lo
cual, es necesario asignarles un determinado factor o ponderación, que se simboliza
por
35
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
2.1.2 Mediana.
Es el valor que divide en dos partes iguales una serie ordenada de datos; es decir,
es el valor central de la serie. Se puede utilizar la mediana como un valor represen-
tativo de un conjunto de datos cuando no sea recomendable utilizar el promedio
aritmético. Se denota por
36
Introducción a la Estadística Descriptiva
Ejemplos:
a) Determinar la mediana del siguiente conjunto de datos:
Ordenando los datos, se tiene: .
valor que ocupa la tercera posición en una lista ordenada de 5 datos.
b) Determinar la mediana de los siguientes datos: .
Cuando el número de datos es par, la mediana es el promedio de los valores centrales.
La lista tiene 6 datos y los dos valores centrales son 6 y 7, por lo cual, la mediana se calcula
así:
Pasos:
1) Determinar el lugar central aplicando la siguiente fórmula:
37
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
Ejemplo:
Determinar la mediana de los datos de la tabla que sigue, la cual contiene datos
hipotéticos de puntuaciones en una prueba de conocimientos:
2 5
4 3
5 8
6 10
7 12
8 13
Total 51
2 5 5 9,80% 9,80%
4 3 8 5,90% 15,70%
5 8 16 15,70% 31,40%
6 10 26 19,60% 51,00%
7 12 38 23,50% 74,50%
8 13 51 25,50% 100,00%
Total 51 1
38
Introducción a la Estadística Descriptiva
Donde:
Calcular la mediana con los datos de la tabla 17, que contiene los puntajes obtenidos por
50 estudiantes en una prueba de conocimientos.
Tabla 17. Ejemplo de cálculo de mediana en datos agrupados en intervalos
39
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
40
Introducción a la Estadística Descriptiva
Año Demanda
1999 5.000
2000 6.000
2001 9.000
2002 15.000
2003 30.000
2004 50.000
Los factores de crecimiento (índices) se obtienen dividiendo cada dato por el anterior; de
este modo, el factor de crecimiento para el año 2000 es:
El año 1999 no tiene factor de crecimiento por ser el primero, el cual se toma como refe-
rencia.
El factor de crecimiento del año 2000 es 1,20 valor que indica un crecimiento del 20% con
respecto al año 1999.
41
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
Cuando los datos están agrupados, la fórmula para el cálculo del promedio geomé-
trico es la siguiente:
Se puede observar que cada factor representa números muy grandes y el producto
de todos los factores es muy dispendioso, por lo cual, es conveniente utilizar loga-
ritmos de los datos.
Ejemplo:
Calcular la media geométrica con los datos de la siguiente tabla, que contiene los
puntajes obtenidos por 50 estudiantes en una prueba de conocimientos.
Grupos
42
Introducción a la Estadística Descriptiva
: cantidad final
: cantidad inicial
: factor de crecimiento
: unidades de tiempo.
Este valor es el factor de crecimiento anual; significa que en cada año la población universi-
taria se va multiplicando por 1,064 y que la rasa de crecimiento es del 6,4% anual.
43
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
Entonces:
Ejemplo:
44
Introducción a la Estadística Descriptiva
X (Vel) F (Km)
100 80
80 120
Total 200
Por tanto, el vehículo recorrió los dos tramos con una velocidad promedio de 86,956 kph.
2.1.5 Moda
45
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
Puntaje
190-220 13
220-250 17
250-280 6
280-310 6
310-340 8
Total 50
La mediana divide una serie de datos ordenados en dos partes iguales, dejando un
50% de información por debajo de este valor y un 50% por encima. Pero la serie
puede dividirse en cuatro, diez o cien partes iguales, dando lugar a cuartiles, deciles
y percentiles.
2.2.1 Cuartiles
46
Introducción a la Estadística Descriptiva
2.2.2 Deciles
De igual forma que para el caso de los cuartiles, se puede dividir una serie ordenada de
datos en 10 pares iguales, denominadas deciles. El primer decil deja por debajo el 10%
de información. El el 20% y así sucesivamente. Para su cálculo se utiliza el mismo pro-
cedimiento que en los cuartiles, solo que en lugar de dividir entre 4, se divide entre 10.
2.2.3 Percentiles
Si se quiere dividir la distribución en 100 partes iguales, se procede de la misma forma que
para los deciles. El primer percentil deja por debajo el 1% de información y es supera-
do por el 99%. El percentil dos supera al 2% y es superado por el 98% de los datos, y
así sucesivamente.
Ejemplo:
La tabla 21 presenta la distribución por edades de 200 estudiantes, con base en la cual se
pide calcular cuartiles, deciles y percentiles.
Tabla 21. Ejemplo de cálculo de medidas de posición
Edad f F H
10-12 10 10 5%
12-14 35 45 22,50%
14-16 95 140 70%
16-18 35 175 87,50%
18-20 15 190 95%
20-22 10 200 100%
Total 200 -
47
Fuente: elaboración propia
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
Este valor indica que el 25% de los estudiantes tiene menos de 14,1 años de edad.
Este valor indica que el 75% de los estudiantes tiene menos de 16,6 años de edad.
Edad
10 - 12 10 10 5 5
12 - 14 35 45 17,5 22,5
14 - 16 95 140 47,5 70,0
16 - 18 35 175 17,5 87,5
18 -20 15 190 7,5 95,0
20 -22 10 200 5,0 100,0
Total 200 100
En este ejemplo, se tiene que el porcentaje de estudiantes con menos de 15 años de edad
es
Aunque el recorrido es una medida muy sencilla de la dispersión de los datos, se puede
utilizar cuando se desea obtener rápidamente el grado de variabilidad; por ejemplo, cuan-
do se quiere comparar las notas de un examen en dos grupos diferentes.
Ejemplo:
Suponga quela tabla 23 contiene las notas máximas y mínimas de dos cursos de Estadística
Descriptiva y se desea comparar el rendimiento de los grupos.
Tabla 23. Ejemplo de cálculo del rango en distribuciones de frecuencia
49
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
De la tabla se puede decir que el rendimiento del Grupo B, fue más homogéneo,
puesto que el rango del Grupo B es menor que el rango de los datos del Grupo A.
Aunque el recorrido es una medida significativa, tiene el inconveniente de estar
afectado solo por los valores extremos. Con el fin de superar este problema se uti-
liza el Rango Intercuartílico, que es la diferencia entre el cuartil y el cuartil
u otra medida de variabilidad.
Entonces
Ejemplo:
50
Introducción a la Estadística Descriptiva
Puntajes
Otra forma de evitar el cero de las desviaciones respecto a la media, es tomar los cuadra-
dos de tales desviaciones; en este caso, el promedio aritmético de estos nuevos valores se
denomina varianza.
2.3.3 Varianza
51
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
Ejemplo:
Tabla 25. Ejemplo de cálculo de varianza en datos agrupados
Puntajes
190-220 13 205 2665 546325
220-250 17 235 3995 938825
250-280 6 265 1590 421350
280-310 6 295 1770 522150
310-340 8 325 2600 845000
Total 50 12620 3273650
52
Introducción a la Estadística Descriptiva
Ejemplo:
Calcular la varianza, desviación estándar y el coeficiente de variación de la distribución de la
siguiente tabla, cuya media es: .
Tabla 26. Ejemplo de cálculo desviación estándar y coeficiente de variación en datos agrupados
Puntajes
La desviación estándar se interpreta como la diferencia promedio que presentan los datos
con respecto al promedio aritmético; esto es, la variable puntajes puede variar hacia arriba
o hacia abajo del promedio en esa cantidad, hasta 3,5 veces. En decir
54
Introducción a la Estadística Descriptiva
55
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
100 130 140 165 166 180 180 230 268 270
278 280 290 300 320 323 325 328 340 350
360 361 362 362 365 368 369 369 370 370
380 385 386 392 395 400 410 415 416 417
420 450 458 459 500 520 521 524 574 594
Fuente: elaboración propia
56
Introducción a la Estadística Descriptiva
57
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
Considerando los datos de la tabla 19, determinar los valores de las medidas de
tendencia central, variabilidad, posición y forma, aplicando los conceptos de mo-
mentos de primero, segundo, tercero y cuarto orden.
58
Introducción a la Estadística Descriptiva
59
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
CAPÍTULO 3.
REGRESIÓN Y CORRELACIÓN
Todas las medidas estadísticas descritas anteriormente permiten hacer un análisis
de una variable, pero hay casos en los cuales se necesita analizar valores apareados,
correspondientes a dos variables, con el fin de determinar si existe o no relación
entre ellas y, en caso afirmativo, determinar el tipo de relación.
Si por cada medida de la variable , existe un valor correspondiente en la variable
, entonces, el conjunto resultante de parejas de valores se denomina distribución
bivariable.
Ejemplos:
• La edad de los estudiantes y su rendimiento académico: X edad, Y
rendimiento.
• Las notas de primer y segundo parcial: X notas primer parcial, Y notas
segundo parcial.
• Estatura y peso de un grupo de personas: estatura, peso.
Cuando se trata únicamente de dos variables, se aplica la regresión y correlación
simple; y para más de dos variables se utiliza regresión y correlación múltiple.
Una manera sencilla para determinar algún tipo de correlación, es representar las
parejas en un plano cartesiano y observar el diagrama de puntos; si estos tienden
a ubicarse alrededor de una recta, la correlación es lineal; además, si tiende a
aumentar cuando aumenta, la correlación es positiva o directa; en cambio, si la
variable disminuye cuando aumenta , la relación es negativa o inversa. Por
su parte, si los puntos están cerca de una curva, la relación es no lineal; y si no se
observa trayectoria alguna en los puntos, no hay relación entre las variables.
En el Gráfico 11, se puede observar que la primera gráfica indica una trayectoria
lineal y positiva, y la segunda muestra una trayectoria no lineal y negativa.
Gráfico 11. Análisis de correlación
60
Introducción a la Estadística Descriptiva
Donde:
Ejemplo:
Sean y las notas obtenidas por seis (6) estudiantes en los cursos de matemáticas y
física, respectivamente.
Estudiantes
A 3 5 15 9 25
B 4 4 16 16 16
C 5 5 25 25 25
D 6 5 30 36 25
E 7 6 42 49 36
F 8 5 40 64 25
Total 33 30 168 199 152
Media 5,5 5 28 33,17 25,33
61
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
Las fórmulas vistas anteriormente son válidas únicamente para la correlación lineal,
pero si se trata de correlación no lineal es necesario otra fórmula que incluya la
ecuación de la curva a la cual se desea ajustar los datos. El estudio de las ecuaciones
que se ajustan a datos observados se llama Regresión.
62
Introducción a la Estadística Descriptiva
63
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
Una vez conocidos los valores estimados de la variable , se puede medir la disper-
sión alrededor de la recta de regresión utilizando un método similar al de método
de la desviación típica o estándar, sólo que, en este caso, la recta de regresión hace
las veces de promedio del fenómeno observado.
64
Introducción a la Estadística Descriptiva
Ejemplo:
Determinar la ecuación de la recta para los datos de la tabla 30.
Tabla 30. Ejemplo para cálculo de regresión
(años) (demanda)
1 200 200 1
2 180 360 4
3 230 690 9
4 230 920 16
5 255 1.275 25
6 270 1.620 36
7 260 1.820 49
Total 28 1.625 6.885 140
Promedio 4 232,14 983,57 20
Fuente: elaboración propia
65
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
De igual manera, se puede calcular los valores estimados para cada uno de los años
anteriores.
Si al valor estimado para 1.989 se le suma y se le resta una desviación estándar, que-
da determinado un intervalo del 68% de confianza para la estimación.
Este resultado indica que la demanda de cupos para el año 1.989 oscila entre 272 y
302.
66
Introducción a la Estadística Descriptiva
Para la denotación de los logaritmos se suele utilizar mayúsculas, pero aquí se usará minúsculas
Mes
Enero 1 25 0 17,4
Febrero 2 15 0,301 1,18 0,354 0,091 24,7
Marzo 3 28 0,477 1,45 0,69 0,228 30,3
Abril 4 35 0,602 1,54 0,93 0,362 35,1
Mayo 5 30 0,699 1,48 1,032 0,489 39,3
Junio 6 70 0,778 1,85 1,436 0,606 43,1
Total 21 203 2,857 8,887 4,442 1,775
Fuente: Cafecol 1997
67
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
68
Introducción a la Estadística Descriptiva
R E G R E S IO N G E O M E T R IC A
P R O D U C C IO N
70
60
50
40
30
20
10
0
1 2 3 4 5 6
MESES
Mes
70
Introducción a la Estadística Descriptiva
60
50
40
30
20
10
0
1 2 3 4 5 6
MESES
Entonces, para el mes de diciembre se espera que la producción de café en Cafecol sea de
191.835 kilos.
Para aplicar el sistema de ecuaciones simplificadas, es necesario construir una nueva varia-
ble la cual se obtiene restando el promedio aritmético a la variable original; es decir:
71
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
72
Introducción a la Estadística Descriptiva
Dado que:
R E G R E S IO N N O L IN E A L ( C U A D R A T IC A )
70
60
50
40
30
20
10
0 E F M A M J
73
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
74
Introducción a la Estadística Descriptiva
CAPÍTULO 4.
SERIES CRONOLÓGICAS
Son herramientas que se utilizan para el análisis de datos de variables que cambian a través
del tiempo.
Generalmente, la serie cronológica muestra los datos por trimestres, en diferentes años.
Utilizando una hoja electrónica, los datos se pueden organizar como se indica en el ejem-
plo que sigue.
Columna A: Años
Columna B: Trimestres
Columna C: Enumeración correlativa de trimestres
Columna D: Variable a estudiar
A B C D E F G H I J K L M
Ejemplo
La tabla 35, presenta el número de viviendas construidas en Pasto de 2010 a 2014.
Tabla 35.Número de viviendas construidas en Pasto del año 2010 al 2014
76
Introducción a la Estadística Descriptiva
Una vez encontrada la tendencia (T) y los Índices Estacionales (S), el producto T*S da una
proyección muy cercana a la realidad. Este método permite proyectar, con mucha exacti-
tud, el número de viviendas a construirse en el año siguiente.
77
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
4.3 TALLER
1. Señale la respuesta correcta.
78
Introducción a la Estadística Descriptiva
100 130 140 165 166 180 180 230 268 270
278 280 290 300 320 323 325 328 340 350
360 361 362 362 365 368 369 369 370 370
380 385 386 392 395 400 410 415 416 417
420 450 458 459 500 520 521 524 574 594
Forme una distribución de frecuencias con intervalos de igual amplitud; determine e in-
terprete: el promedio aritmético, la mediana, los cuarteles, el percentil 80, la varianza, la
desviación estándar y el coeficiente de variabilidad. Determine el porcentaje de estudiantes
que tienen puntajes en el intervalo:
3. El conteo bacterial de cierto cultivo pasó de 1000 a 4000 en tres días. Determinar lo
siguiente:
a) El incremento promedio porcentual por día.
b) El factor de crecimiento diario.
c) El número de días en el cual se duplicaría el valor inicial
4.-Al señor Pérez, empleado de la compaña Ecopetrol, le consignaron su cesantía en Hori-
zonte, por valor de $18.000.000,oo. Si el rendimiento es del 3% mensual, calcular:
a) El valor de su cesantía después de un año.
b) E factor de crecimiento.
c) El tiempo en el cual se duplicaría el valor inicial de su cesantía.
5. Las exportaciones de Café, en millones de dólares en los últimos años fueron las siguien-
tes:
79
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
150 150 180 165 166 167 255 267 268 270
278 280 290 300 320 323 325 328 340 350
360 361 362 362 365 368 369 369 370 370
380 385 386 392 395 400 410 415 416 417
420 450 458 459 500 520 521 524 574 597
80
Introducción a la Estadística Descriptiva
a)
b)
c)
a) El promedio adecuado.
b) El promedio si todos los pesos fueran iguales.
11. Tres profesores de Economía registraron calificaciones medias de sus exámenes, así:
79; 82 y 84. Sus clases estaban conformadas por 32, 25 y 17 estudiantes. ¿Cuál es la califi-
cación media del grupo?
12. Los siguientes datos corresponden a los porcentajes autorizados por el gobierno nacio-
nal para el incremento de salarios a trabajadores oficiales en el presente año. Determinar
el promedio ponderado.
81
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
Se pide lo siguiente:
a) Determinar los cuatro primeros momentos con respecto al origen y los cuatro
momentos centrales.
b) Expresar los momentos centrales en función de los momentos con respecto al
origen.
15. La siguiente tabla contiene las utilidades mensuales en miles de pesos, de 200
socios de una empresa comunitaria de la ciudad de Pasto en el año 2007. Determi-
nar los siguiente:
a) La varianza, aplicando tres métodos diferentes.
b) La desviación estándar y el coeficiente de variabilidad.
c) El percentil 75.
d) El porcentaje de socios que tienen utilidades inferiores a $ 35.000.
Miles de pesos F
20 - 24 12
24 – 28 36
28 - 32 84
32 - 36 52
36 - 40 16
Total 200
16. Los precios de un artículo durante los primeros meses del año, fueron los
siguientes:
82 Junio 2100
Introducción a la Estadística Descriptiva
Determinar:
a) Índices de crecimiento, índice acumulado, índice promedio mensual, el aumento pro-
medio mensual.
b) Las cuatro ecuaciones de regresión mencionadas en el punto 4.
17. La siguiente tabla muestra la altura del padre (X) y del hijo (Y), en pulgadas.
X 65 63 67 64 62 70 72 68 66 69 71
Y 68 66 68 65 66 68 65 71 67 68 70
Determinar:
a) La ecuación de la recta de regresión y los valores estimados
b) El error típico de estimación
c) Sume y reste el error típico de estimación a todos los valores estimados y construya e
interprete un gráfico de líneas.
18. La tabla siguiente muestra la distribución de frecuencias de la vida media de 400 válvu-
las de radio probadas en la empresa L & M; determinar:
a) La frecuencia relativa de la sexta clase.
b) El porcentaje de válvulas cuya vida media, no pasa de 600 horas.
c) El porcentaje de válvulas cuya vida media es mayor o igual a 900
d) El porcentaje de válvulas cuya vida media es superior al Promedio Aritmético.
83
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
Velocidad Distancia
20 4
30 7
40 9
50 12
60 14
70 16
80 20
Años 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
Desempleo 12.7 11.0 10.0 8.4 12.5 13.8 15.7 18.0 19.8 23.4
Se pide lo siguiente:
a) Determinar la ecuación de la recta y los valores estimados,
el error de estimación y los límites del 68% de confianza. Realizar un gráfico de
líneas.
b) Determinar las ecuaciones las siguientes ecuaciones:
d) Comparar los resultados del literal c) y decidir cuál es la mejor ecuación de esti-
mación.
22. El salario anual pagado a los empleados de una compañía es de $ 4.500.000.
84
Introducción a la Estadística Descriptiva
Los salarios medios pagados a los hombres y a las mujeres fueron de $ 4.950.000 y $
4.450.000 respectivamente. Determinar el porcentaje de hombres y mujeres empleados en la
compañía.
23. La siguiente tabla presenta las utilidades mensuales en miles de pesos en 1998, de 200
socios de una empresa comunitaria de la ciudad de Pasto.
Miles de $ f
20 - 24 12
24 - 28 36
28 - 32 84
32 - 36 52
36 - 40 16
Total 200
85
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
86
Introducción a la Estadística Descriptiva
índice de Tablas
Tabla 1. Ejemplo de Rendimiento académico
y selección de carrera de un grupo de estudiantes.............................................. 16
Tabla 2. Resumen de datos de la variable género de la tabla 1........................ 17
Tabla 3. Edad y género con los datos de la tabla 1........................................... 18
Tabla 4. Género y jornada con datos de la tabla 1........................................... 19
Tabla 5. Modelo de tabla de frecuencias absolutas........................................... 20
Tabla 6. Modelo de distribución de frecuencias absolutas y relativas.............. 20
Tabla 7. Distribución de frecuencias con los datos de inasistencia
a clases de un grupo escolar representados en el cuadro 1................................. 21
Tabla 8. Distribución de frecuencias con los datos hipotéticos
de una prueba de conocimientos de 50 estudiantes, calificada en
una escala de 100 a 400, representados en el cuadro 2....................................... 25
Tabla 9. Notas parciales hipotéticas de Estadística Descriptiva
del primer parcial de Estadística Descriptiva en el período A-2019
de la Universidad de Nariño, representados en el cuadro 3................................ 28
Tabla 10. Puntajes hipotéticos de una prueba
de conocimientos aplicada a 50 estudiantes en una escala
de 1 a 400, representados en el cuadro 4............................................................. 31
Tabla 11. Ejemplo de desviación de datos
no agrupados respecto a la media......................................................................... 32
Tabla 12. Ejemplo de cálculo de desviación en datos
agrupados respecto a la media con los datos de la tabla 10................................ 33
Tabla 13. Distribución de frecuencias para cálculo
de promedio por método abreviado con los datos de la tabla 10...................... 35
Tabla 14. Cálculo del promedio con pesos ponderados.................................. 36
Tabla 15. Modelo de tabla para cálculo de mediana en datos agrupados....... 37
Tabla 16. Ejemplo de cálculo de mediana en datos
87
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
88
Introducción a la Estadística Descriptiva
índice de Cuadros
Cuadro 1. Datos hipotéticos de inasistencia
a clases de un grupo de estudiantes...................................................................... 21
Cuadro 2. Datos hipotéticos de una prueba de
conocimientos de 50 estudiantes calificados en
una escala de 100 a 400 puntos............................................................................. 24
Cuadro 3. Notas hipotéticas del primer parcial de
Estadística Descriptiva en el período A-2019
de la Universidad de Nariño.................................................................................. 27
Cuadro 4. Puntajes hipotéticos de una prueba de
conocimientos aplicada a 50 estudiantes en una escala de 1 a 400..................... 31
Cuadro 5. Datos hipotéticos de pago de matrícula
de 50 estudiantes de la Universidad de Nariño.................................................... 56
89
Javier Alberto Mesa Guerrero
Segundo Javier Caicedo Zambrano
índice de Gráficos
Gráfico 1. Representación gráfica de la variable género................................... 17
Gráfico 2. Representación gráfica de género y edad........................................ 18
Gráfico 3. Género y jornada.............................................................................. 19
Gráfico 4. Frecuencias relativas con los datos de la tabla 7.............................. 22
Gráfico 5. Frecuencias acumuladas con los datos
de la tabla 7............................................................................................................. 22
Gráfico 6. Histograma de frecuencias relativas
con los datos de la tabla 8...................................................................................... 26
Gráfico 7. Polígono de frecuencias relativas con
los datos de la tabla 8............................................................................................. 26
Gráfico 8. Frecuencia acumulada ascendente
con los datos de la tabla 8...................................................................................... 27
Gráfico 9. Histograma de frecuencias ............................................................... 28
Gráfico 10. Distribución de con datos de la tabla 27....................................... 57
Gráfico 11. Análisis de correlación.................................................................... 60
Gráfico 12. Ejemplo de regresión lineal............................................................ 67
Gráfico 13. Ejemplo de Regresión Geométrica................................................ 69
Gráfico 14. Ejemplo de Regresión Exponencial................................................ 71
Gráfico 15. Ejemplo de Regresión Cuadrática.................................................. 73
Gráfico 16. Ejemplo de viviendas construida. Construcción propia................ 78
90
Introducción a la Estadística Descriptiva
REFERENCIAS BIBLIOGRÁFICAS
BENJAMIN, J.R. Probabilidad y Estadística en Ingeniería Civil. Ed. McGraw-Hill.
Bogotá. 1981
CHAO, Lincoln, Estadística aplicada a las ciencias administrativas. Ed. Mc Graw Hill.
México 1.985
CHOU, Ya Lun. Análisis Estadístico. Ed. Interamericana. México. 1977
CANAVOS, George C. Probabilidad y Estadística Ma. Graw Hill-México 1984
HANKE John E./ Reitsh. Estadística para negocios. Mc Graw Hill. México 1994.
HERNÁNDEZ, Roberto y otros. Metodología de la Investigación. Ed. McGraw-Hill.
México. 1999.
KAZMIER , Leonard. Estadística para la Administración y la Economía. Serie
Schaum. Mc Graw Hill. México 1998.
LEVIN Ricahrd & RUBIN David. Estadística para administradores. Prentice Hall.
México 1994.
MARTOS, José. Statgraphics Conceptos y Aplicaciones. Ed. Paraninfo. Madrid.
2001.
MARTINEZ BENCARDINO, Ciro. Estadística. Ed. ECOE. Bogotá 1978.
MENDENHALL, William. Introducción a la probabilidad yu Estadística. Wastworth
Internacional.E.E.UU. 1.979
MILLER Y FREUND. JOHNSON RICHARD Probabilidad y Estadística para Ingenie-
ros. 5a. Ed. Prentice May Hispanoamericana S.A. México. 1964.
SPIEGEL, Murray. Estadística. Teoría y 875 problemas resueltos. Serie Schaum. Ed.
McGraw-Hill. México. 1970.
91
Introducción a la Estadística Descriptiva
93