Práctica 2 - Estadística
Práctica 2 - Estadística
Práctica 2 - Estadística
Estadístic
Universidad de Granada
Práctica 2
ESTADÍSTICA DESCRIPTIVA: REPRESENTACIONES
GRÁFICAS
Objetivos
1. Resumir, ordenar y analizar conjuntos de datos
2. Calcular diversas características de una variable estadística univariante
3. Representar grá camente la distribución de frecuencias
4. Realizar análisis exploratorio de datos.
El SPSS proporciona varias herramientas para realizar esta descripción, todas ellas bajo el menú
Analizar y, dentro de él, la opción Estadísticos descriptivos. Estos procedimientos son: Frecuencias…,
Descriptivos… y Explorar….
Procedimiento “Frecuencias…”
El procedimiento Frecuencias… proporciona representaciones estadísticas y grá cas que son útiles
para la descripción de distintos tipos de variables. Permite obtener una descripción de la variable a
partir de las tablas de frecuencias, histogramas, grá cos de barras, percentiles, índices de tendencia
central e índices de dispersión.
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 1/30
11/9/2019 Práctica 2 | Estadística
En esta ventana se presentan cuatro botones de comandos: Estadísticos… (para obtener estadísticos
descriptivos para las variables cuantitativas), Grá cos… (para hacer grá cos de barras, grá cos de
sectores e histogramas), Formato… (para elegir el orden en el que se muestran los resultados) y
Boostrap… (para realzar muestreo boostrap). Además, se muestra la opción Mostrar tablas de
frecuencias, que por defecto aparece seleccionada.
En esta ventana se marcan los estadísticos descriptivos que se quieran estudiar y se pulsa Continuar.
Pinchando en Grá cos… se obtiene el siguiente Cuadro de diálogo, en el que se puede elegir el Tipo
de grá co y los Valores del grá co.
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 2/30
11/9/2019 Práctica 2 | Estadística
Pinchando en Formato… se obtiene el siguiente Cuadro de diálogo, que permite que las tablas de
frecuencias puedan ordenarse según los valores de la variable o según las frecuencias observadas.
Además, para aquellas variables con un gran número de valores diferentes se puede optar por
Suprimir tablas con más de n categorías o por agrupar los datos en categorías.
Nota: Para analizar una parte de las observaciones seleccionadas según algún criterio se debe elegir
previamente en el Menú principal Datos/Seleccionar casos…
Pinchando en Boostrap… se obtiene el siguiente Cuadro de diálogo, que permite realizar muestreo
boostrap
Procedimiento “Descriptivos…”
El procedimiento Descriptivos… calcula estadísticos de tendencia central, dispersión y distribución
para varias variables, mostrándolos en una única tabla y calcula valores tipi cados (puntuaciones z).
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 3/30
11/9/2019 Práctica 2 | Estadística
Si selecciona Guardar valores tipi cados como variables, se guardan las puntuaciones z, éstas se
añaden a los datos del Editor de datos, quedando disponibles para posteriores análisis. Las
transformaciones de puntuación z permiten la comparación de variables que se registran en diferentes
unidades de medidas.
Restablecer permite restablecer todas las opciones por defecto del sistema y elimina del Cuadro de
diálogo todas las asignaciones hechas con las variables
Continuar permite aceptar las asignaciones hechas con las variables
Cancelar permite ignorar todas las asignaciones hechas con las variables
Pegar envía la sintaxis del procedimiento a la ventana de sintaxis
Aceptar, elegidas las especi caciones, se pulsa el botón Aceptar para obtener los resultados del
procedimiento.
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 4/30
11/9/2019 Práctica 2 | Estadística
que permite hallar características de tendencia central, de dispersión, de distribución y ordenar las
variables por el tamaño de sus medias (en orden ascendente o descendente), alfabéticamente o por el
orden en el que se seleccionen las variables (el valor por defecto).
Procedimiento “Explorar…”
El procedimiento Explorar genera estadísticos de resumen y representaciones grá cas como Diagrama
de cajas, grá cos de tallo y hojas, histogramas, diagramas de normalidad y diagramas de dispersión
por nivel con pruebas de Levene.
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 5/30
11/9/2019 Práctica 2 | Estadística
donde se selecciona una o más variables dependientes (Lista de dependientes:) Si se desea, es posible
seleccionar una o más variables de factor (Lista de Factores:) cuyos valores de nirán grupos de casos;
o bien seleccionar una variable de identi cación para etiquetar casos (Etiquetar los casos mediante:).
En dicho cuadro de diálogo se presentan tres botones de comandos: Estadísticos… (para: Intervalos de
con anza para la media, Estimadores robustos centrales, Valores atípicos y Percentiles), Grá cos…
(para Diagramas de cajas, de tallo y hojas, histogramas, pruebas y grá cos de probabilidad normal y
diagramas de dispersión por nivel con la prueba de Levene), Opciones… (para el tratamiento de
valores perdidos) y Boostrap… (para realizar muestreo boostrap). Si en Visualización se marca la
opción Ambos muestra resultados estadísticos y grá cos; si se marca Estadísticos muestra sólo los
resultados estadísticos y si se marca Grá cos muestra sólo resultados grá cos.
El Diagrama de cajas es una forma de representación grá ca para resumir la distribución de los
valores de una variable. En esta representación en vez de visualizar los valores individuales, se
representan estadísticos básicos de la distribución: la mediana, el percentil 25, el percentil 75 y los
extremos de la distribución. Esta representación grá ca está basada en 5 medidas estadísticas. La caja
representa el 50% de las observaciones correspondientes a cada nivel del factor y se construye desde
el primer cuartil al tercer cuartil; dentro de ella se destaca la posición de la mediana. Se construye un
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 6/30
11/9/2019 Práctica 2 | Estadística
bigote desde hasta el mínimo y otro bigote desde hasta el máximo, siempre que sus
El diagrama de caja viene determinado por los valores de los cuartiles, y la línea que aparece
dentro del diagrama representa el valor de la mediana
Los límites, a partir de los cuales se dibujan los bigotes del diagrama de caja y se marcan los
valores extremos, se calculan del siguiente modo:
Los valores fuera de los límites están etiquetados (en SPSS por el número de caso al que
corresponden, cuando no se ha especi cado ninguna variable para etiquetar). En la gura anterior
se representan con un círculo aquellos valores que sobrepasan los límites LI y LS y con un asterisco
los que sobrepasan los límites LI* y LS*, que se calculan del siguiente modo:
En resumen:
Se consideran dos categorías de casos extremos, en función de cuánto se alejan con respecto del
50% central de la distribución. Aquellos casos con valores alejados más de 3 veces el rango
intercuartílico desde el extremo superior o inferior de la caja (casos más extremos, representados
con un (*) y aquellos valores que están alejados entre 1.5 y 3 veces dicho rango, representados con
un círculo.
Los valores más pequeño y más grande que estén dentro de los límites primer cuartil -1.5 y tercer
cuartil +1.5 veces el rango intercuartílico constituyen los bigotes del grá co y aparecen
representados mediante las dos líneas horizontales dibujadas a ambos extremos de la caja central.
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 7/30
11/9/2019 Práctica 2 | Estadística
Diagrama de tallos y hojas: Una técnica que se utiliza para la observación de la forma de la
distribución de frecuencias es el diagrama de tallo y hojas, que es una representación grá ca en la
que los datos se colocan en dos niveles de tal modo que podemos visualizar la forma de la
distribución. Un diagrama de tallos y hojas consiste en una serie de las horizontales de números. En
la primera columna se escriben los llamados tallos, junto a ella se traza una línea vertical y, a su
derecha, en cada la se escriben las correspondientes hojas. El número utilizado para designar una
la es su tallo, el resto de números de la la se denominan hojas. El tallo es la mayor porción del
número. Por ejemplo, en los números 1.0, 2.3, 1.4, 1.1, 3.5, 4.6, 5.1, 5.3, 5.7 y 5.9. Los primeros dígitos
servirán como nombre de los tallos (1, 2, 3, 4, 5). Las hojas dan una información secundaria acerca del
número, en nuestro ejemplo sería la cifra decimal. (Véase Estadística para Biología y Ciencias
Ambientales: Tratamiento Informático mediante SPSS. Ana Lara (2010) pág 47).
Grá cos con prueba de normalidad: Mediante este procedimiento se comprueba si los datos proceden
de una población normal y para ello se sirve de dos grá cos y un contraste analítico. (Este
procedimiento se utilizará en prácticas más avanzadas).
Pinchando en Opciones… se obtienen las siguientes opciones para el tratamiento de Valores perdidos
Seleccionando en el Menú principal Grá cos, se obtiene la siguiente ventana, donde se muestran los
distintos grá cos que se pueden realizar.
Para proceder a realizar algún tipo de grá co interactivo se selecciona en el Menú principal
Grá cos/Generador de grá cos… y se muestra la siguiente gura
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 8/30
11/9/2019 Práctica 2 | Estadística
donde se selecciona el grá co que se desee realizar (En el ejercicio guiado de esta práctica se muestra
como se realiza un histograma interactivo).
donde se elige el tipo de grá co que se desee. Por ejemplo, si se selecciona Grá cos/Cuadros de
diálogo antiguos/Barras…, se muestra la siguiente gura
donde se puede elegir entre realizar un Grá co de barras Simple, Agrupado o Apilado. Si se elige
Agrupado se pulsa a continuación De nir y se muestra la siguiente ventana
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 9/30
11/9/2019 Práctica 2 | Estadística
Para crear un grá co de barras agrupado se debe seleccionar una variable de categorías y una variable
de agrupación. De esta forma, una vez pulsado el botón Aceptar, se genera un grá co de barras de las
categorías elegidas agrupado por la variable de agrupación elegida.
El procedimiento estándar de generación de grá cos se inicia con la elección, desde el Menú principal,
del tipo de grá co deseado. Tras esta elección el programa solicita mayor información acerca de las
características del grá co deseado. Esto generalmente se realiza a través de un Cuadro de diálogo
especí co.
Evidentemente, a un mayor conocimiento de los datos que se analizan y con una idea clara de las
grá cas que se quieren obtener, se seguirá un mayor aprovechamiento de las capacidades grá cas del
SPSS. En este punto, es importante animar a la experimentación, es decir, a la generación de distintas
grá cas que pongan en evidencia, desde distintos puntos de vista, la circunstancia que se quiera
resaltar. Posteriormente habrá tiempo de seleccionar aquella que se ajuste mejor a nuestros objetivos.
Con rmada la de nición del grá co mediante el correspondiente botón de Aceptar, en el Visor de
resultados aparece el grá co creado. Seleccionándolo con el ratón y pulsando el boton derecho se
muestra la siguiente gura donde se elige Editar contenido /En otra ventana (O bien pulsando dos
veces sobre el grá co).
Se abre el Editor de grá cos, que permite realizar modi caciones en el grá co. Para seleccionar
objetos en el grá co se pulsa en ellos, o bien se utiliza el menú de la ventana del Editor de grá cos
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 10/30
11/9/2019 Práctica 2 | Estadística
Ventana de Resultados
Se observa que la parte superior de la ventana muestra
que indica el nombre que SPSS da por defecto al chero de resultados, Resultados1 y el nombre de la
ventana, IBM SPSS Statistics Visor
Esta ventana de resultados presenta una Barra de menú similar a la que muestra el Editor de datos,
ampliada con dos nuevos menús: Insertar y Formato.
A continuación se muestra un menú de iconos que permite el acceso más rápido a algunas de las
opciones.
Ejemplo
Con los datos almacenados en el chero Datos1
Pulsar Aceptar
Pulsar De nir
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 12/30
11/9/2019 Práctica 2 | Estadística
En el Editor de grá cos, que se muestra haciendo doble clik sobre el grá co, hay diversos botones que
permiten distintas opciones de edición: se puede cambiar el color, cambiar el tipo de letra, mover las
leyendas de los ejes….
Pulsar De nir
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 13/30
11/9/2019 Práctica 2 | Estadística
En la ventana resultante introducir en la casilla De nir sectores por: la variable Sexo y en Panel
mediante las: la variable Cali cación. Se puede seleccionar en Los sectores representan: frecuencias
absolutas, % de casos y Sumas de la variable.
2. Estadísticos e Histograma
Realizar tablas de frecuencias, representaciones grá cas (histograma), calcular estadísticos de
tendencia central, dispersión, forma, posición (Percentiles 25, 50 y 75) con las variables cuantitativas.
Pulsar Estadísticos…Para calcular los percentiles pedidos se activa la casilla Percentiles: es escribe el
percentil correspondiente y se pula Añadir
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 14/30
11/9/2019 Práctica 2 | Estadística
En la misma salida se muestran las Tablas de frecuencias para cada variable seleccionada.
Se pulsa Aceptar
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 15/30
11/9/2019 Práctica 2 | Estadística
Para obtener el diagrama de cajas se selecciona en el Menú principal Grá cos/Cuadros de diálogo
antiguos/Diagrama de cajas
1. Realizamos un Diagrama de cajas Simple en las variables Puntuación1 y Puntuación2 para el grupo
total de individuos. Para ello, seleccionar Simple y Resúmenes para distintas variables. Se pulsa
De nir y en el cuadro de diálogo resultante, introducir las variables Puntuación1 y Puntuación2 en la
casilla Las cajas representan:
Se pulsa Aceptar
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 16/30
11/9/2019 Práctica 2 | Estadística
2. Realizamos un Diagrama de cajas agrupado por la variable Sexo: Para ello, seleccionar Agrupado y
Resúmenes para distintas variables. Se pulsa De nir y en el cuadro de diálogo resultante, introducir
las variables Puntuación1 y Puntuación2 en la casilla Las cajas representan: y la Variable Sexo en la
casilla Eje de categorías:
Se pulsa Aceptar
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 17/30
11/9/2019 Práctica 2 | Estadística
Se pulsa Aceptar
Ejercicios
Ejercicio Guiado
Si no tienes instalada la Máquina Virtual Java (Java Runtime Environment – JRE) pincha en
uno de los enlaces para descargarla:
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 18/30
11/9/2019 Práctica 2 | Estadística
IMPORTANTE: Si al descargar el archivo *.JAR del ejercicio tu gestor de descargas intenta guardarlo
como *.ZIP debes cambiar la extensión a .JAR para poder ejecutarlo.
Se pide:
Ejercicios Propuestos
Ejercicio Propuesto 1
Las autoridades sanitarias de un municipio están interesadas en evaluar la calidad del agua para
consumo, en términos de colonias de bacterias tró cas, en un acuífero próximo a la ciudad. Se
consideran dos zonas diferentes del acuífero y se obtienen los siguientes resultados (número de
colonias por 1000 mm de agua):
zona 1: 194 199 191 202 215 214 197 204 199 202 230 193 194 209
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 19/30
11/9/2019 Práctica 2 | Estadística
zona 2: 158 161 143 174 220 156 156 156 198 161 188 139 147 116
Se pide:
Un estudio comparativo de la calidad del agua en ambas zonas utilizando medidas estadísticas y
grá cos. Para ello realizar los siguientes apartados:
Ejercicio Propuesto 2
Un agrónomo mide el contenido de humedad en una variedad de trigo tras ser secados especialmente.
Para ello, hace las mediciones en 56 muestras de una tonelada de trigo. Los resultados se muestran
en la tabla adjunta
Se pide:
zona 1: 194 199 191 202 215 214 197 204 199 202 230 193 194 209
zona 2: 158 161 143 174 220 156 156 156 198 161 188 139 147 116
Se pide:
Un estudio comparativo de la calidad del agua en ambas zonas utilizando medidas estadísticas y
grá cos. Para ello realizar los siguientes apartados:
Solución:
1. Calcular media, varianza, moda, mediana, máximo y mínimo de ambas zonas.
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 20/30
11/9/2019 Práctica 2 | Estadística
Los valores de la media, mediana y moda, para el nº de colonias de la zona 2 son inferiores a los
obtenidos para el nº de colonias de la zona 1, de lo que se deduce que la calidad del agua en la zona
2 es claramente superior. Con respecto a los valores obtenidos para la varianza en ambas variables,
podemos ver que la variabilidad es superior para el nº de colonias de la zona 2.
Para saber en que zona hay mayor dispersión se debe de calcular el Coe ciente de Variación de
Pearson, CV, (Cociente entre la desviación típica y la media) que representa el número de veces que la
desviación típica contiene a la media, por tanto, cuanto mayor sea el coe ciente de variación de
Pearson signi ca que mayor número de veces contiene la desviación típica a la media y por tanto la
media aritmética es menos representativa.
Los resultados nos muestran que hay mayor dispersión en la zona 2 ya que el coe ciente de variación
es mayor que el de la zona 1
2. Representar grá camente los datos con un histograma para cada variable.
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 21/30
11/9/2019 Práctica 2 | Estadística
Grá camente son evidentes las diferencias existentes entre los valores de las variables. Se observa
como para el caso de nº de colonias de la zona 1, el grueso de las observaciones se encuentra entre
los valores 190 y 210, y para el nº de colonias de la zona 2, entre 140 y 180. Lo que está en
consonancia con los resultados obtenidos anteriormente, los valores de la media, mediana y moda
para el nº de colonias de la zona 2 son inferiores a los obtenidos para el nº de colonias de la zona 1.
3. Representar grá camente los datos con un diagrama de caja simple (donde los datos del grá co son
resúmenes para distintas variables).
Para obtener el diagrama de caja, seleccionamos en el Menú principal Grá cos/ Cuadros de diálogo
antiguos/Diagramas de caja
En el Cuadro de diálogo resultante se marca la opción Simple y en Los datos del grá co son se marca
la opción Resúmenes para distintas variables
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 22/30
11/9/2019 Práctica 2 | Estadística
donde las variables se pasan al cuadro denominado Las cajas representan: y se pulsa Aceptar. Se
muestra la siguiente representación grá ca
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 23/30
11/9/2019 Práctica 2 | Estadística
Los valores fuera de los límites están etiquetados por el número de caso al que corresponden,
puesto que no se ha especi cado ninguna variable para etiquetar. Se representan con un círculo
aquellos valores que sobrepasan los límites LI y LS y con un asterisco los que sobrepasan los
límites LI* y LS*, que se calculan del siguiente modo:
Se pide:
c) Grá co de cajas
e) Determinar la media, mediana y desviación típica del Contenido de humedad en cada grupo
Solución:
La columna Número indica las frecuencias. Es preciso, previo a realizar los análisis, ponderar los
valores de la variable Contenido mediante la variable Número Datos/Ponderar casos
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 24/30
11/9/2019 Práctica 2 | Estadística
c) Grá co de cajas
Forma una nueva variable con el nombre Contenido1 que se obtiene recodi cando la variable
Contenido en tres categorías:
e) Determinar la media, mediana y desviación típica del Contenido de humedad en cada grupo
Para efectuar análisis estadístico para cada grupo se elige en el Menú principal Datos/Segmentar
archivo
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 26/30
11/9/2019 Práctica 2 | Estadística
Los grá cos se pueden hacer pulsando la opción de Grá cos en Analizar/Estadísticos
descriptivos/Frecuencias (o Descriptivos o Explorar) o bien Grá cos/Cuadros de diálogos
antiguos/Barras.
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 27/30
11/9/2019 Práctica 2 | Estadística
Si se selecciona Agrupado en vez de Simple los grá cos correspondientes no cambian ya que está
activado Datos/Segmentar archivo.
try this
26 febrero, 2018 at 00:32
I simply want to mention I am just very new to blogs and actually savored you’re
blog site. Very likely I’m want to bookmark your site . You de nitely come with really
good posts. Appreciate it for sharing your blog site.
Responder
Responder
Deja un comentario
Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *
Comentario
Nombre *
Correo electrónico *
Web
Publicar comentario
Práctica 2
1. Objetivos
2. Introducción al Análisis Descriptivo
3. Procedimiento “Frecuencias…”
4. Procedimiento “Descriptivos…”
5. Procedimiento “Explorar…”
6. Procedimiento “Grá cos”
7. Ventana de Resultados
8. Ejemplo
9.1. Ej. Guiado
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 29/30
11/9/2019 Práctica 2 | Estadística
wpd.ugr.es/~bioestad/guia-spss/practica-2/ 30/30