Practico 1 - Estadistica Descriptiva
Practico 1 - Estadistica Descriptiva
Practico 1 - Estadistica Descriptiva
Práctico 1:
Estadística descriptiva y
visualización de datos
Objetivo: poner en práctica los conceptos de estadística descriptiva y visualización de datos
trabajados en el Módulo 2 del curso.
Vamos a trabajar con la base de datos SERCE: Segundo Estudio Regional Comparativo y Explicativo:
los aprendizajes de los estudiantes de América Latina y el Caribe; reporte técnico
Responsable: UNESCO
Resumen: Entre los años 2004 y 2008 el Laboratorio Latinoamericano de Evaluación de la Calidad
de la Educación LLECE realizó el Segundo Estudio Regional Comparativo y Explicativo (SERCE) que
evalúa el desempeño de los estudiantes en América Latina y el Caribe e indaga sus factores
asociados. Dicho estudio se enmarca dentro de las acciones de la OREALC / UNESCO, tendientes a
asegurar el derecho de todos los estudiantes de la región a recibir una educación de calidad. El
principal propósito del SERCE fue generar conocimientos acerca de los rendimientos de los
estudiantes de 3º y 6º grados de Educación Primaria en América Latina y el Caribe en las áreas de
Matemática, Lenguaje (Lectura y Escritura) y Ciencias y, al mismo tiempo, explicar dichos logros
identificando las características de los estudiantes, de las aulas y de las escuelas que se asocian a
ellos en cada una de las áreas evaluadas.
1) Vamos a crear una tabla de frecuencia para la variable Sexo (nominal). Los pasos a seguir son:
a) Seleccionar toda la base de datos
b) Menú: Insertar > Tabla dinámica. Aparecerá una ventana preguntando dónde deseamos
crear la Tabla. Seleccionar “Nueva hoja”.
c) Ir a la nueva hoja (con nombre Tabla Dinámica X). Aparecerá un Menú de Editor de tablas
dinámicas a la derecha de la ventana. En el Menú de Editor de tablas dinámicas:
i) En Filas > Añadir > Seleccionar Sexo (nominal)
1
Métodos y técnicas cuantitativas
Maestrías, Facultad de Psicología, UdelaR
Edición 2022
ii) En Valores > Añadir > Sexo (nominal). Bajo “Sumar por” debe aparecer por defecto
“COUNTA”, si no aparece, seleccionarlo de la lista.
iii) Ahora, en la Tabla dinámica podemos ver que la muestra se compone de 333 niñas y 347
niños, y que suman un total de 680 casos. ¿Podemos expresarlo en frecuencias relativas
(porcentajes) en lugar de en frecuencias absolutas (número de casos)? Explorar las
opciones de la pestaña de Editor de tablas dinámicas y observar cómo se modifican los
valores en la Tabla. Podemos obtener frecuencias absolutas y frecuencias relativas ¿Qué
porcentaje representan las niñas y los niños respectivamente?
2) Ahora vamos a crear una nueva tabla de frecuencia, esta vez para la variable Educación_Madre.
Repetir los pasos descritos en la Actividad 1) con la variable Educación_Madre. Observando la
tabla, ¿cuál es la moda de la variable? ¿Qué porcentaje de la muestra representa?
3) Ahora vamos a combinar ambas tablas de frecuencia para crear una tabla de contingencia. Esta
nos permitirá ver la proporción/porcentaje de niños y niñas para cada nivel educativo alcanzado
por la madre. Los pasos a seguir son:
a) Repetir los pasos descritos en la Actividad 1) hasta c), ii). Deberíamos ver la tabla de
frecuencias para la variable Sexo tal como en la Actividad 1). Ahora, vamos a agregar la
variable Educación_Madre en la misma tabla. En el Menú de Editor de tablas dinámicas:
i) En Columnas > Añadir > Seleccionar Educación_Madre.
ii) Ahora, en la Tabla dinámica podemos ver que, de las 333 niñas, hay 94 cuyas madres
completaron la Primaria, 160 cuyas madres completaron la Secundaria, y 73 cuyas
madres completaron la Universidad. Análogamente podemos ver los valores
correspondientes a los niños. Nuevamente, ¿podemos expresarlo en frecuencias relativas
(porcentajes)? Explorar las opciones de la pestaña de Editor de tablas dinámicas y
observar cómo se modifican los valores en la Tabla. En especial, observar cómo se
modifican los valores cuando elegimos las distintas opciones de porcentaje. Por ejemplo,
cuando elegimos “Porcentaje de la fila”, vemos que, de todas las niñas, hay un 28,23%
cuyas madres completaron la Primaria. ¿Qué pasa cuando elegimos “Porcentaje de la
columna”? Vemos que, de todas las madres que completaron la Primaria, el 48,21%
corresponden a madres de niñas. A partir de la tabla completar los siguientes
enunciados:
(1) Del total de niños y niñas en la muestra, hay _________% cuyas madres completaron la
Universidad.
(2) Del total de niños/as cuyas madres que completaron la Secundaria, el ______%
corresponden a madres de niñas y el _______% correspocdnden a madres de niños.
2
Métodos y técnicas cuantitativas
Maestrías, Facultad de Psicología, UdelaR
Edición 2022
(3) Del total de la muestra, el ______% corresponde a niños (varones) cuyas madres
completaron la Primaria, el ______% corresponde a niños (varones) cuyas madres
completaron la Secundaria, y el ______% corresponde a niños (varones) cuyas madres
completaron la Universidad.
Usualmente describimos las variables cuantitativas a través de medidas de tendencia central (media,
mediana) y dispersión (desvío estándar, varianza, otros). En esta sección vamos a calcular
estadísticos descriptivos para distintas variables. Para ello vamos a usar funciones. Las funciones se
usan siempre siguiendo los mismos criterios. Por ejemplo, si queremos calcular el promedio de la
variable Literatura, escribimos:
=AVERAGE(G2:G681)
Analicemos la función
1
Que tiene buenas razones de ser
3
Métodos y técnicas cuantitativas
Maestrías, Facultad de Psicología, UdelaR
Edición 2022
2) Ahora, repetir el mismo procedimiento para calcular estadísticos descriptivos para las variables
Matemáticas y Ciencias. ¿En qué disciplina se ve mejor desempeño?3
3) Ahora, vamos a calcular la media para la variable Literatura según el nivel educativo de la
madre. Para eso vamos a hacer una tabla dinámica de contingencia, pero de forma un poco
diferente. Los pasos a seguir son:
a) Crear una tabla dinámica. Seleccionar:
i) En Filas > Añadir > Seleccionar Educación_Madre
ii) En Valores > Añadir > Seleccionar Literatura. En la opción “Sumar por”, seleccionar
AVERAGE
iii) En Valores > Añadir > Seleccionar Ciencia. En la opción “Sumar por”, seleccionar
AVERAGE
iv) En Valores > Añadir > Seleccionar Matemática. En la opción “Sumar por”, seleccionar
AVERAGE
¿Qué podemos decir sobre la relación del nivel educativo de la madre y el nivel de
desempeño en las pruebas SERCE?
3 Gráficos
2
Tip! Podemos obtener una visión rápida de estadísticos descriptivos seleccionando la columna
correspondiente a una variable, y en Menú > Datos > Estadísticas de columna
3
Solo podemos afirmar que, en la muestra, se observa mejor desempeño en una determinada disciplina.
Sin embargo, si queremos –y queremos– hacer afirmaciones sobre la población, entonces debemos usar
herramientas de estadística inferencial en las que ahondaremos en los próximos prácticos.
4
Métodos y técnicas cuantitativas
Maestrías, Facultad de Psicología, UdelaR
Edición 2022
5
Métodos y técnicas cuantitativas
Maestrías, Facultad de Psicología, UdelaR
Edición 2022
1) Supongamos que queremos mostrar de forma gráfica la tabla de frecuencia calculada para la
variable Educación_madre (Sección 1.2)). Podemos hacerlo de dos formas, como gráfico de
barras, o como gráfico de torta. Los pasos a seguir son:
a) Corroborar que la tabla dinámica calculada en la Sección 1.2) está expresada en porcentajes,
de lo contrario modificarla.
b) Seleccionar toda la tabla dinámica.
c) Menú: Insertar > Gráfico. Aparecerá un Menú de Editor de gráficos a la derecha de la ventana
4
. En “Tipo de gráfico” seleccionar “Gráfico de columnas”.
d) Ahora vamos a mejorarlo un poco:
i) En el Menú de Editor de gráficos, ir a “Personalizar”.
(1) En “Título de gráfico y ejes”:
(a) seleccionar “Título del gráfico”, en “Texto del título” ingresar “Nivel educativo
completado por la madre”.
(b) seleccionar “Título del eje vertical”, en “Texto del título” ingresar “Porcentaje”.
(c) seleccionar “Título del eje horizontal”, en “Texto del título” borrar el texto que
aparece por defecto.
(2) En “Serie”, en “Formato”, modificar el color de relleno.
e) Ahora vamos a mostrar los mismos datos, pero en formato de gráfico de tortas (o gráfico
circular). En el Menú de Editor de gráficos, en “Configuración”, en “Tipo de gráfico”,
seleccionar “Gráfico circular”. ¿En qué tipo de gráfico crees que se observa mejor la
distribución?
2) Supongamos que queremos mostrar de forma gráfica las medias para las variables Literatura,
Ciencias y Matemáticas [Sección 2.1) y 2.2)]. Lo haremos como un gráfico de barras. Primero,
vamos a recrear la tabla en una hoja nueva para que el gráfico sea más sencillo de hacer (y de
paso aprendemos algo más sobre manejo de datos). La nueva tabla debe lucir así:
Una opción podría ser ingresar a mano o copiar y pegar los valores a partir de la pestaña de base
de datos. Sin embargo, si luego hacemos algún cambio en la base de datos, por ejemplo, excluir a
los participantes con valores faltantes, tendremos que volver a ingresar los datos a mano. Una
4
Siempre puedo hacer aparecer el menú haciendo doble clic sobre el Gráfico, y lo mismo para las Tablas
dinámicas
6
Métodos y técnicas cuantitativas
Maestrías, Facultad de Psicología, UdelaR
Edición 2022
alternativa, más eficiente, es indicarle a la hoja de cálculo que copie en en cada celda de la nueva
tabla el valor de otra celda. Esto se puede hacer ingresando el signo de igual y la posición de la
celda a copiar. Por ejemplo, si quiero que en la nueva tabla aparezca el valor de la media para
literatura, puedo ingresar:
=’base de datos’!G685
Esto significa: “ingresá en esta celda el contenido de la celda G685 de la pestaña base de datos”.
El nombre de la pestaña va entre comillas y el signo de exclamación separa el nombre de la
pestaña del indicador de fila y columna de la celda. Si no quiero escribir, puedo pararme sobre la
celda, ingresar el signo de =, ir a la pestaña de base de datos, pararme sobre la celda que quiero
que se copie, y dar Enter. Automáticamente el cursor debería volver a nuestra nueva hoja y en la
celda sobre la que estábamos trabajando debería decir “548,2”. Si hacemos doble clic sobre la
celda, deberíamos ver la función, que se escribió automáticamente: =’base de datos’!G685.
Veamos un paso a paso:
7
Métodos y técnicas cuantitativas
Maestrías, Facultad de Psicología, UdelaR
Edición 2022
i) Configuración > desmarcar la casilla de “Cambiar filas/columnas” (al final del menú).
Ahora verás que cada columna tiene su propio color, esto se debe a que cada variable es
su propia “Serie”.
ii) Personalizar > Serie > seleccionar serie “Literatura”
iii) Marcar la casilla “Barras de errores”. En “Tipo” elegir “constante”. En “Valor” ingresar a
mano el valor de desviación típica de la variable Literatura que se muestra en la tabla.
iv) Repetir los pasos ii y iii para las variables Matemáticas y Ciencias
v) Modificar el título del gráfico y de los ejes horizontal y vertical. Y, ¿ por qué no modificar
los colores?
¡Yapa!
¿Llegaste hasta acá y te quedan tiempo y ganas?
¿Te animás a hacer un gráfico de dispersión con las variables Literatura y
Matemática? A partir del gráfico, ¿qué correlación te parece que habrá
entre las variables? Podés comprobar la correlación en el panel de datos de
cuanti.