Practico 1 - Estadistica Descriptiva

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 8

Métodos y técnicas cuantitativas

Maestrías, Facultad de Psicología, UdelaR


Edición 2022

Práctico 1:
Estadística descriptiva y
visualización de datos
Objetivo: poner en práctica los conceptos de estadística descriptiva y visualización de datos
trabajados en el Módulo 2 del curso.

Vamos a trabajar con la base de datos SERCE: Segundo Estudio Regional Comparativo y Explicativo:
los aprendizajes de los estudiantes de América Latina y el Caribe; reporte técnico

Responsable: UNESCO

Resumen: Entre los años 2004 y 2008 el Laboratorio Latinoamericano de Evaluación de la Calidad
de la Educación LLECE realizó el Segundo Estudio Regional Comparativo y Explicativo (SERCE) que
evalúa el desempeño de los estudiantes en América Latina y el Caribe e indaga sus factores
asociados. Dicho estudio se enmarca dentro de las acciones de la OREALC / UNESCO, tendientes a
asegurar el derecho de todos los estudiantes de la región a recibir una educación de calidad. El
principal propósito del SERCE fue generar conocimientos acerca de los rendimientos de los
estudiantes de 3º y 6º grados de Educación Primaria en América Latina y el Caribe en las áreas de
Matemática, Lenguaje (Lectura y Escritura) y Ciencias y, al mismo tiempo, explicar dichos logros
identificando las características de los estudiantes, de las aulas y de las escuelas que se asocian a
ellos en cada una de las áreas evaluadas.

1 Estadística descriptiva de variables categóricas:


tablas de frecuencia y moda

1) Vamos a crear una tabla de frecuencia para la variable Sexo (nominal). Los pasos a seguir son:
a) Seleccionar toda la base de datos
b) Menú: Insertar > Tabla dinámica. Aparecerá una ventana preguntando dónde deseamos
crear la Tabla. Seleccionar “Nueva hoja”.
c) Ir a la nueva hoja (con nombre Tabla Dinámica X). Aparecerá un Menú de Editor de tablas
dinámicas a la derecha de la ventana. En el Menú de Editor de tablas dinámicas:
i) En Filas > Añadir > Seleccionar Sexo (nominal)

1
Métodos y técnicas cuantitativas
Maestrías, Facultad de Psicología, UdelaR
Edición 2022

ii) En Valores > Añadir > Sexo (nominal). Bajo “Sumar por” debe aparecer por defecto
“COUNTA”, si no aparece, seleccionarlo de la lista.
iii) Ahora, en la Tabla dinámica podemos ver que la muestra se compone de 333 niñas y 347
niños, y que suman un total de 680 casos. ¿Podemos expresarlo en frecuencias relativas
(porcentajes) en lugar de en frecuencias absolutas (número de casos)? Explorar las
opciones de la pestaña de Editor de tablas dinámicas y observar cómo se modifican los
valores en la Tabla. Podemos obtener frecuencias absolutas y frecuencias relativas ¿Qué
porcentaje representan las niñas y los niños respectivamente?
2) Ahora vamos a crear una nueva tabla de frecuencia, esta vez para la variable Educación_Madre.
Repetir los pasos descritos en la Actividad 1) con la variable Educación_Madre. Observando la
tabla, ¿cuál es la moda de la variable? ¿Qué porcentaje de la muestra representa?
3) Ahora vamos a combinar ambas tablas de frecuencia para crear una tabla de contingencia. Esta
nos permitirá ver la proporción/porcentaje de niños y niñas para cada nivel educativo alcanzado
por la madre. Los pasos a seguir son:
a) Repetir los pasos descritos en la Actividad 1) hasta c), ii). Deberíamos ver la tabla de
frecuencias para la variable Sexo tal como en la Actividad 1). Ahora, vamos a agregar la
variable Educación_Madre en la misma tabla. En el Menú de Editor de tablas dinámicas:
i) En Columnas > Añadir > Seleccionar Educación_Madre.
ii) Ahora, en la Tabla dinámica podemos ver que, de las 333 niñas, hay 94 cuyas madres
completaron la Primaria, 160 cuyas madres completaron la Secundaria, y 73 cuyas
madres completaron la Universidad. Análogamente podemos ver los valores
correspondientes a los niños. Nuevamente, ¿podemos expresarlo en frecuencias relativas
(porcentajes)? Explorar las opciones de la pestaña de Editor de tablas dinámicas y
observar cómo se modifican los valores en la Tabla. En especial, observar cómo se
modifican los valores cuando elegimos las distintas opciones de porcentaje. Por ejemplo,
cuando elegimos “Porcentaje de la fila”, vemos que, de todas las niñas, hay un 28,23%
cuyas madres completaron la Primaria. ¿Qué pasa cuando elegimos “Porcentaje de la
columna”? Vemos que, de todas las madres que completaron la Primaria, el 48,21%
corresponden a madres de niñas. A partir de la tabla completar los siguientes
enunciados:
(1) Del total de niños y niñas en la muestra, hay _________% cuyas madres completaron la
Universidad.
(2) Del total de niños/as cuyas madres que completaron la Secundaria, el ______%
corresponden a madres de niñas y el _______% correspocdnden a madres de niños.

2
Métodos y técnicas cuantitativas
Maestrías, Facultad de Psicología, UdelaR
Edición 2022

(3) Del total de la muestra, el ______% corresponde a niños (varones) cuyas madres
completaron la Primaria, el ______% corresponde a niños (varones) cuyas madres
completaron la Secundaria, y el ______% corresponde a niños (varones) cuyas madres
completaron la Universidad.

2 Estadística descriptiva de variables cuantitativas:


tendencia central y dispersión

Usualmente describimos las variables cuantitativas a través de medidas de tendencia central (media,
mediana) y dispersión (desvío estándar, varianza, otros). En esta sección vamos a calcular
estadísticos descriptivos para distintas variables. Para ello vamos a usar funciones. Las funciones se
usan siempre siguiendo los mismos criterios. Por ejemplo, si queremos calcular el promedio de la
variable Literatura, escribimos:

=AVERAGE(G2:G681)

Analicemos la función

● comienza con el signo de =,


● sigue con el nombre de la función (en este caso es AVERAGE, pero podría ser STDEV para la
desviación estándar)
● y luego paréntesis curvo. Dentro del paréntesis curvo se indica el rango de valores sobre el que se
quiere usar la función
● El rango de valores se especifica indicando la primera celda y la última celda de la columna sobre la
que quiero trabajar, separadas por dos puntos.
● Las celdas se indican con una letra y un número (¡como en el barco hundido!). Por ejemplo, la
variable Literatura comienza en la celda G2 y termina en la celda G681. El rango de valores de la
variable literatura es G2:G681
● Usualmente, usamos una celda al final de la columna para escribir la función y alojar ahí el resultado.
Esto es una convención1, puedo hacerlo en cualquier celda de la planilla.

1) Vamos a calcular estadísticos descriptivos para la variable Literatura. Pasos a seguir:


a) Hacer clic en la celda G682

1
Que tiene buenas razones de ser

3
Métodos y técnicas cuantitativas
Maestrías, Facultad de Psicología, UdelaR
Edición 2022

b) Ingresar la función: =AVERAGE(G2:G681). ¿Cuánto es la media de puntajes en Literatura?


c) Repetir el procedimiento para obtener el mínimo (MIN), el máximo (MAX), la mediana
(MEDIAN) y el desvío (STDEV). Usar las celdas G683 a G687 para escribir las funciones. 2

2) Ahora, repetir el mismo procedimiento para calcular estadísticos descriptivos para las variables
Matemáticas y Ciencias. ¿En qué disciplina se ve mejor desempeño?3

3) Ahora, vamos a calcular la media para la variable Literatura según el nivel educativo de la
madre. Para eso vamos a hacer una tabla dinámica de contingencia, pero de forma un poco
diferente. Los pasos a seguir son:
a) Crear una tabla dinámica. Seleccionar:
i) En Filas > Añadir > Seleccionar Educación_Madre
ii) En Valores > Añadir > Seleccionar Literatura. En la opción “Sumar por”, seleccionar
AVERAGE
iii) En Valores > Añadir > Seleccionar Ciencia. En la opción “Sumar por”, seleccionar
AVERAGE
iv) En Valores > Añadir > Seleccionar Matemática. En la opción “Sumar por”, seleccionar
AVERAGE
¿Qué podemos decir sobre la relación del nivel educativo de la madre y el nivel de
desempeño en las pruebas SERCE?

3 Gráficos

3.1 Histograma y distribución

1) Vamos a construir un histograma de la variable Literatura. Este nos permitirá conocer la


distribución de la variable. Los pasos a seguir son:
a) Seleccionar toda la columna de la variable Literatura
b) Menú: Insertar > Gráfico. Aparecerá una pestaña de Editor de gráficos a la derecha de la
ventana. Si no se seleccionó automáticamente, elegir Tipo de gráfico: Histograma. ¿Se

2
Tip! Podemos obtener una visión rápida de estadísticos descriptivos seleccionando la columna
correspondiente a una variable, y en Menú > Datos > Estadísticas de columna
3
Solo podemos afirmar que, en la muestra, se observa mejor desempeño en una determinada disciplina.
Sin embargo, si queremos –y queremos– hacer afirmaciones sobre la población, entonces debemos usar
herramientas de estadística inferencial en las que ahondaremos en los próximos prácticos.

4
Métodos y técnicas cuantitativas
Maestrías, Facultad de Psicología, UdelaR
Edición 2022

observa una distribución simétrica o asimétrica? Revisar los valores de media y


mediana calculados antes, ¿se parecen?
c) Vamos a modificar el número de bins (separaciones) del gráfico para ver su efecto sobre la
visualización.
d) Menú: Editor de gráficos. Clic sobre Personalizar
e) Clic sobre Histograma. Opción: Tamaño de los segmentos. Modificar el tamaño de los
segmentos y observar los cambios en la visualización del histograma. ¡Recordar! Es
necesario seleccionar un tamaño de bins adecuado al rango y cantidad de valores en el
gráfico. A menudo es necesario probar varios tamaños de bins hasta encontrar uno
que me permite ver correctamente la distribución.
2) A modo de comparación, veamos el siguiente histograma. Éste se basa en la Encuesta Continua
de Hogares (2021) del INE y muestra el ingreso total por hogar (con valor locativo, sin servicio
doméstico).
La media de ingreso es de 88952 pesos y la mediana es de 70980. ¿Qué nos dice la diferencia
de media y mediana sobre la distribución? ¿Es simétrica?

3.2 Barras, tortas, y barras con error

5
Métodos y técnicas cuantitativas
Maestrías, Facultad de Psicología, UdelaR
Edición 2022

1) Supongamos que queremos mostrar de forma gráfica la tabla de frecuencia calculada para la
variable Educación_madre (Sección 1.2)). Podemos hacerlo de dos formas, como gráfico de
barras, o como gráfico de torta. Los pasos a seguir son:
a) Corroborar que la tabla dinámica calculada en la Sección 1.2) está expresada en porcentajes,
de lo contrario modificarla.
b) Seleccionar toda la tabla dinámica.
c) Menú: Insertar > Gráfico. Aparecerá un Menú de Editor de gráficos a la derecha de la ventana
4
. En “Tipo de gráfico” seleccionar “Gráfico de columnas”.
d) Ahora vamos a mejorarlo un poco:
i) En el Menú de Editor de gráficos, ir a “Personalizar”.
(1) En “Título de gráfico y ejes”:
(a) seleccionar “Título del gráfico”, en “Texto del título” ingresar “Nivel educativo
completado por la madre”.
(b) seleccionar “Título del eje vertical”, en “Texto del título” ingresar “Porcentaje”.
(c) seleccionar “Título del eje horizontal”, en “Texto del título” borrar el texto que
aparece por defecto.
(2) En “Serie”, en “Formato”, modificar el color de relleno.
e) Ahora vamos a mostrar los mismos datos, pero en formato de gráfico de tortas (o gráfico
circular). En el Menú de Editor de gráficos, en “Configuración”, en “Tipo de gráfico”,
seleccionar “Gráfico circular”. ¿En qué tipo de gráfico crees que se observa mejor la
distribución?

2) Supongamos que queremos mostrar de forma gráfica las medias para las variables Literatura,
Ciencias y Matemáticas [Sección 2.1) y 2.2)]. Lo haremos como un gráfico de barras. Primero,
vamos a recrear la tabla en una hoja nueva para que el gráfico sea más sencillo de hacer (y de
paso aprendemos algo más sobre manejo de datos). La nueva tabla debe lucir así:

Una opción podría ser ingresar a mano o copiar y pegar los valores a partir de la pestaña de base
de datos. Sin embargo, si luego hacemos algún cambio en la base de datos, por ejemplo, excluir a
los participantes con valores faltantes, tendremos que volver a ingresar los datos a mano. Una

4
Siempre puedo hacer aparecer el menú haciendo doble clic sobre el Gráfico, y lo mismo para las Tablas
dinámicas

6
Métodos y técnicas cuantitativas
Maestrías, Facultad de Psicología, UdelaR
Edición 2022

alternativa, más eficiente, es indicarle a la hoja de cálculo que copie en en cada celda de la nueva
tabla el valor de otra celda. Esto se puede hacer ingresando el signo de igual y la posición de la
celda a copiar. Por ejemplo, si quiero que en la nueva tabla aparezca el valor de la media para
literatura, puedo ingresar:
=’base de datos’!G685
Esto significa: “ingresá en esta celda el contenido de la celda G685 de la pestaña base de datos”.
El nombre de la pestaña va entre comillas y el signo de exclamación separa el nombre de la
pestaña del indicador de fila y columna de la celda. Si no quiero escribir, puedo pararme sobre la
celda, ingresar el signo de =, ir a la pestaña de base de datos, pararme sobre la celda que quiero
que se copie, y dar Enter. Automáticamente el cursor debería volver a nuestra nueva hoja y en la
celda sobre la que estábamos trabajando debería decir “548,2”. Si hacemos doble clic sobre la
celda, deberíamos ver la función, que se escribió automáticamente: =’base de datos’!G685.
Veamos un paso a paso:

a) Menú: Insertar > Hoja. Moverse a la nueva hoja creada.


i) Pararse en la celda B2
ii) Ingresar signo “=”
iii) Ir a la pestaña de base de datos, y hacer clic sobre la celda G685 (donde está calculada la
media de Literatura). Luego Enter. Automáticamente el cursor debería volver a nuestra
nueva hoja y en la celda B2 debería aparecer el valor de la media de Literatura.
b) Repetir el procedimiento para completarlos valores de media y desvío de la tabla.
c) Escribir a mano los títulos de las filas y columnas de la tabla (Literatura, Ciencias,
Matemáticas; media, desvío). Siempre es bueno tener las tablas rotuladas para saber qué hay
en cada celda.
d) Ahora, para crear el gráfico a partir de la tabla, los pasos a seguir son:
i) Seleccionar las filas 1 y 2 de la tabla (ignorar la fila 3)
ii) Menú: Insertar > Gráfico
iii) Por defecto va a insertar un Gráfico circular, pero queremos un gráfico de columnas.
Modificar el tipo de gráfico en el Editor de gráficos para obtener un gráfico de
columnas.
e) ¡Muy bien! Ya estamos mostrando la media de puntajes para cada variable. Peeero,
podríamos dar un poco más de información, ¿qué tal incluir una barra de error que muestre
la desviación típica? Para eso tenemos que hacer un pequeño truco. En el Menú Editor de
gráficos:

7
Métodos y técnicas cuantitativas
Maestrías, Facultad de Psicología, UdelaR
Edición 2022

i) Configuración > desmarcar la casilla de “Cambiar filas/columnas” (al final del menú).
Ahora verás que cada columna tiene su propio color, esto se debe a que cada variable es
su propia “Serie”.
ii) Personalizar > Serie > seleccionar serie “Literatura”
iii) Marcar la casilla “Barras de errores”. En “Tipo” elegir “constante”. En “Valor” ingresar a
mano el valor de desviación típica de la variable Literatura que se muestra en la tabla.
iv) Repetir los pasos ii y iii para las variables Matemáticas y Ciencias
v) Modificar el título del gráfico y de los ejes horizontal y vertical. Y, ¿ por qué no modificar
los colores?

¡Felicitaciones! Haz creado un gráfico de barras con error 😊


3) ¿Te animás a mostrar gráficamente la tabla de doble entrada obtenida en la Actividad 2.3):
Media de puntajes en pruebas SERCE según el nivel educativo de la madre? ¿Se observa algún
patrón?

¡Yapa!
¿Llegaste hasta acá y te quedan tiempo y ganas?
¿Te animás a hacer un gráfico de dispersión con las variables Literatura y
Matemática? A partir del gráfico, ¿qué correlación te parece que habrá
entre las variables? Podés comprobar la correlación en el panel de datos de
cuanti.

También podría gustarte