Introduccion Geoestadistica Unamba
Introduccion Geoestadistica Unamba
Introduccion Geoestadistica Unamba
La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las
observaciones, para poder hacer comparaciones y sacar conclusiones.
• Recogida de datos.
• Organización y representación de datos.
• Análisis de datos.
• Obtención de conclusiones.
CONCEPTOS DE ESTADÍSTICA
Población
Una población es el conjunto de todos los elementos a los que se somete a un estudio
estadístico.
Individuo
Un individuo o unidad estadística es cada uno de los elementos que componen la
población.
Muestra
Una muestra es un conjunto representativo de la población de referencia, el número de
individuos de una muestra es menor que el de la población.
Muestreo
El muestreo es la reunión de datos que se desea estudiar, obtenidos de una proporción
reducida y representativa de la población.
Valor
Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio
estadístico.
Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y sello.
Dato
Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si
lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, sello, cara, sello.
DEFINICIÓN DE VARIABLE
Variable estadística
Una variable estadística es cada una de las características o cualidades que poseen los
individuos de una población.
Tipos de variable estadísticas
Variable cualitativa
Las variables cualitativas se refieren a características o cualidades que no pueden ser
medidas con números. Podemos distinguir dos tipos:
Variable cuantitativa
Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden
realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:
Variable discreta
Una variable discreta es aquella que toma valores aislados, es decir no admite valores
intermedios entre dos valores específicos. Por ejemplo:
El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.
Variable continua
Una variable continua es aquella que puede tomar valores comprendidos entre dos
números.
Por ejemplo:
La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
En la práctica medimos la altura con dos decimales, pero también se podría dar con tres
decimales.
Los datos
• Todo conjunto de datos tiene al menos dos características
principales:
CENTRO Y DISPERSIÓN
• Los gráficos de barra, histogramas, de puntos, entre otros,
nos dan cierta idea sobre ellos.
2
Estadísticos
• Los estadísticos son resúmenes de los datos muestrales.
Describen una distribución según como se comporta el centro,
su dispersión y su forma. Se agrupan en estadísticos de:
Tendencia central
Posición
Dispersión
Forma
• Estadísticos de tendencia central: Se ubican al centro de la
distribución de los datos.
• Media aritmética (centro de gravedad de los datos)
• Moda (valor de la variable con mayor frecuencia)
• Mediana (valor central en el 50%)
3
Formato de una Tabla de Frecuencias para
variables cualitativas
4
Ejemplo 1: Distribución de establecimientos por
estrato socioeconómico,
SIMCE 2009. 8vo Básico.
• Fuente: www.simce.cl
Formato de una Tabla de Frecuencias para
variables cuantitativas
8
Ejemplo 2: Puntaje en Matemática. SIMCE
2009 8vo Básico.
Representación Gráfica
Gráfico de Barras Verticales
…Gráfico de Barras Horizontales.
…Gráfico de Tortas.
…Histograma.
…Polígono de Frecuencias.
…Gráfico de Dispersión.
…Box-plot (Caja con bigotes).
Media aritmética
• En datos sin tabular:
20
Mediana
• En datos sin tabular: los datos se ordenan de menor a mayor
y se ubica el valor central. Si hay dos valores centrales,
entonces se promedian.
• En datos tabulados:
21
Moda
• En datos sin tabular: es el valor de la variable con mayor
frecuencia.
• En datos tabulados:
22
Relación entre Media, Mediana y Moda
• Si media=moda=mediana, la distribución es simétrica
• Si media > mediana, la distribución es asimétrica con cola a la
derecha (sesgada a la derecha).
• Si media < mediana, la distribución es asimétrica con cola a la
izquierda (sesgada a la izquierda).
23
Estadísticos de Dispersión
• Las medidas de tendencia central son útiles pero nos dan una
interpretación parcial de los datos. Consideremos los dos
siguientes conjuntos de datos:
• Desviación estándar
Es una medida de la dispersión de las observaciones a la media. Es
un promedio de la distancia de las observaciones a la media.
30
…Varianza muestral
31
…Varianza muestral
• En datos sin tabular: Si x1, x2, …, xn denota una muestra con
n observaciones, la varianza muestral se denota por:
32
…Varianza muestral
• A menudo se prefiere la desviación estándar en relación con
la varianza, porque se expresa en las mismas unidades físicas
de las observaciones.
• Si los datos están tabulados:
33