Resúmenes Gráficos
Resúmenes Gráficos
Resúmenes Gráficos
Para construir un diagrama de tallos y hojas de un conjunto de datos que forman una muestra, cada elemento
de la muestra se divide en dos partes: una para los tallos, que consta de uno o dos dígitos que están en el
extremo izquierdo y otra para las hojas, consistente en el siguiente dígito significativo. Un diagrama de tallos
y hojas con pocos tallos puede no ofrecer una representación adecuada de la distribución. Este inconveniente
se soluciona aumentando el número de tallos en el diagrama. Una manera sencilla de hacerlo consiste en
escribir dos veces cada valor del tallo y después registrar las hojas 0, 1, 2, 3 y 4 enfrente del valor del tallo
adecuado, donde aparezca por primera vez; y las hojas 5, 6, 7, 8 y 9 enfrente de este mismo valor del tallo,
donde aparece la segunda vez, de este modo se tiene un diagrama de doble tallo y hojas. Para identificar los
tallos que corresponden a las hojas 0 a 4 y a los que corresponden a las hojas 5 a 9 se puede agregar después
del tallo un símbolo y •, respectivamente, o las letras a y b.
• Histogramas. Es un gráfico que se puede usar para tener una impresión aproximada de la forma de
una muestra, indicando las regiones donde los puntos de la muestra están concentrados y las regiones
donde son escasos. Para construir un histograma se sigue lo siguiente:
- Se construye una tabla de frecuencias.
- Intervalo de clase. Dividen la muestra en grupos. No hay ninguna regla ni difícil ni fácil respecto de cómo
escoger los puntos finales de los intervalos de clase. En general, es mejor tener más intervalos que menos,
pero es también bueno tener un número grande de puntos de la muestra en los intervalos. En ocasiones
es razonable tomar el número de intervalos de clase aproximadamente igual a la raíz cuadrada de la
muestra.
- Frecuencia relativa de un intervalo de clase es la proporción de puntos de datos que están en el intervalo.
La suma de las frecuencias relativas debe dar 1.
- Densidad. Es la frecuencia relativa dividida entre el ancho de clase. La densidad representa la frecuencia
relativa por unidad.
Simetría y sesgo
Resumen:
Los histogramas tienen las propiedades siguientes:
• El área de cada rectángulo representa la proporción de la muestra en el intervalo de clase
correspondiente.
• La altura de cada rectángulo representa la densidad de la muestra en el intervalo de clase
correspondiente.
• El área total bajo el histograma es igual a 1.
• La media muestral es casi igual al centro de masa del histograma. La aproximación se hace
más cercana cuando se hacen rectángulos más angostos.
• La varianza muestra les aproximadamente igual al momento de inercia del histograma con
respecto a su centro de masa. La aproximación es más cercana cuando se hacen rectángulos
más angostos.
Como se mencionó antes, el diagrama de tallo y hojas representa una manera de resumir los datos.
El mismo diagrama de tallo y hojas se puede usar para para resumir los datos por medio de una
distribución de frecuencias, donde los datos, son agrupados en diferentes clases o intervalos, se
pueden construir contando las hojas que pertenecen a cada tallo y considerando que cada tallo define
un intervalo de clase.
Distribución de frecuencias relativas. Al dividir cada frecuencia de clase entre el número total de
observaciones se obtiene la frecuencia relativa. Una tabla que lista las frecuencias relativas se llama
distribución de frecuencias relativas.
EJEMPLO
Las siguientes puntuaciones representan la calificación en el examen final para un curso de
estadística elemental:
23 60 79 32 57 74 52 70 82
36 80 77 81 95 41 65 92 85
55 76 52 10 64 75 78 25 80
98 81 67 41 71 83 54 64 72
88 62 74 43 60 78 89 76 84
48 84 90 15 79 34 67 17 82
69 74 63 80 85 61
a) Elabore un diagrama de tallo y hojas para las calificaciones del examen, donde los tallos sean 1,
2, 3, …, 9.
b) Determine una distribución de frecuencias relativas.
c) Elabore un histograma de frecuencias relativas, trace un estimado de la gráfica de la distribución
y discuta la asimetría de la distribución.
d) Calcule la media, la mediana y la desviación estándar de la muestra.
SOLUCIÓN
=1.0
0.2
Frecuencia relativa
0.15
0.1
0.05
0
14.5 24.5 34.5 44.5 54.5 64.5 74.5 84.5 94.5
0.2
Frecuencia relativa
0.15
0.1
0.05
0
14.5 24.5 34.5 44.5 54.5 64.5 74.5 84.5 94.5
Punto medio (PM) o marca de clase