Introduccion Geoestadistica Unamba

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 41

ESTADÍSTICA

La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las
observaciones, para poder hacer comparaciones y sacar conclusiones.

Un estudio estadístico consta de las siguientes fases:

• Recogida de datos.
• Organización y representación de datos.
• Análisis de datos.
• Obtención de conclusiones.
CONCEPTOS DE ESTADÍSTICA
Población
Una población es el conjunto de todos los elementos a los que se somete a un estudio
estadístico.
Individuo
Un individuo o unidad estadística es cada uno de los elementos que componen la
población.
Muestra
Una muestra es un conjunto representativo de la población de referencia, el número de
individuos de una muestra es menor que el de la población.
Muestreo
El muestreo es la reunión de datos que se desea estudiar, obtenidos de una proporción
reducida y representativa de la población.
Valor
Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio
estadístico.
Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y sello.
Dato
Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si
lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, sello, cara, sello.

DEFINICIÓN DE VARIABLE
Variable estadística
Una variable estadística es cada una de las características o cualidades que poseen los
individuos de una población.
Tipos de variable estadísticas

Variable cualitativa
Las variables cualitativas se refieren a características o cualidades que no pueden ser
medidas con números. Podemos distinguir dos tipos:

Variable cualitativa nominal


Una variable cualitativa nominal presenta modalidades no numéricas que no admiten un
criterio de orden. Por ejemplo:
El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.
Variable cualitativa ordinal o variable cuasicuantitativa
Una variable cualitativa ordinal presenta modalidades no númericas, en las que existe un
orden. Por ejemplo:
La nota en un examen: suspenso, aprobado, notable, sobresaliente.
Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, ...
Medallas de una prueba deportiva: oro, plata, bronce.

Variable cuantitativa
Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden
realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:
Variable discreta
Una variable discreta es aquella que toma valores aislados, es decir no admite valores
intermedios entre dos valores específicos. Por ejemplo:
El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.

Variable continua
Una variable continua es aquella que puede tomar valores comprendidos entre dos
números.
Por ejemplo:
La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
En la práctica medimos la altura con dos decimales, pero también se podría dar con tres
decimales.
Los datos
• Todo conjunto de datos tiene al menos dos características
principales:
CENTRO Y DISPERSIÓN
• Los gráficos de barra, histogramas, de puntos, entre otros,
nos dan cierta idea sobre ellos.

2
Estadísticos
• Los estadísticos son resúmenes de los datos muestrales.
Describen una distribución según como se comporta el centro,
su dispersión y su forma. Se agrupan en estadísticos de:
Tendencia central
Posición
Dispersión
Forma
• Estadísticos de tendencia central: Se ubican al centro de la
distribución de los datos.
• Media aritmética (centro de gravedad de los datos)
• Moda (valor de la variable con mayor frecuencia)
• Mediana (valor central en el 50%)

3
Formato de una Tabla de Frecuencias para
variables cualitativas

donde Ci es la categoría de la variable, ni es la frecuencia absoluta, Ni


frecuencia acumulada, fi frecuencia relativa y Fi frecuencia relativa
acumulada de la i-ésima clase, respectivamente.

4
Ejemplo 1: Distribución de establecimientos por
estrato socioeconómico,
SIMCE 2009. 8vo Básico.

• Fuente: www.simce.cl
Formato de una Tabla de Frecuencias para
variables cuantitativas

donde ni es la frecuencia absoluta, Ni frecuencia acumulada, fi


frecuencia relativa y Fi frecuencia relativa acumulada de la i-
ésima categoría (clase), respectivamente.
7
…Formato de una Tabla de Frecuencias para
variables cuantitativas

donde yi es la marca (punto medio) de la i-ésima clase.

8
Ejemplo 2: Puntaje en Matemática. SIMCE
2009 8vo Básico.
Representación Gráfica
Gráfico de Barras Verticales
…Gráfico de Barras Horizontales.
…Gráfico de Tortas.
…Histograma.
…Polígono de Frecuencias.
…Gráfico de Dispersión.
…Box-plot (Caja con bigotes).
Media aritmética
• En datos sin tabular:

donde xi es el i-ésimo dato y n es el tamaño de la muestra.


• En datos tabulados:

donde yi es la marca de la i-ésima clase (o categoría), ni la


frecuencia absoluta de la i-ésima clase y k es el número de
categorías.

20
Mediana
• En datos sin tabular: los datos se ordenan de menor a mayor
y se ubica el valor central. Si hay dos valores centrales,
entonces se promedian.
• En datos tabulados:

la mediana se encuentra dentro de la clase (categoría) que


contiene a la posición n/2. Donde Li es el límite inferior de
esta clase, c es la amplitud de esta clase, Ni-1 es la frecuencia
acumulada anterior a esta clase y ni es la frecuencia
absoluta.

21
Moda
• En datos sin tabular: es el valor de la variable con mayor
frecuencia.
• En datos tabulados:

donde ni es la frecuencia absoluta mayor.


Si una distribución muestra dos valores modales, indicaría la
posibilidad que dos poblaciones se encuentren mezcladas y
sea necesario separarlas.

22
Relación entre Media, Mediana y Moda
• Si media=moda=mediana, la distribución es simétrica
• Si media > mediana, la distribución es asimétrica con cola a la
derecha (sesgada a la derecha).
• Si media < mediana, la distribución es asimétrica con cola a la
izquierda (sesgada a la izquierda).

23
Estadísticos de Dispersión
• Las medidas de tendencia central son útiles pero nos dan una
interpretación parcial de los datos. Consideremos los dos
siguientes conjuntos de datos:

• Rango: Es la medida de variabilidad o dispersión más simple. Se


calcula tomando la diferencia entre el valor máximo y el mínimo
observado. Rango = Máximo – Mínimo.
29
Desviación estándar
• Analizar cuáles podrían ser las ventajas y desventajas del rango
como medida de variabilidad.

• Desviación estándar
Es una medida de la dispersión de las observaciones a la media. Es
un promedio de la distancia de las observaciones a la media.

30
…Varianza muestral

La varianza muestral está definida como la suma de las desviaciones al


cuadrado divididas por el tamaño muestral menos 1, es decir, dividas por n − 1 .

31
…Varianza muestral
• En datos sin tabular: Si x1, x2, …, xn denota una muestra con
n observaciones, la varianza muestral se denota por:

• La desviación estándar muestral, denotada por s, es la raíz


cuadrada de la varianza

• La varianza y la desviación estándar no son medidas de


variabilidad distintas, debido a que la última no puede
determinarse a menos que se conozca la primera.

32
…Varianza muestral
• A menudo se prefiere la desviación estándar en relación con
la varianza, porque se expresa en las mismas unidades físicas
de las observaciones.
• Si los datos están tabulados:

• donde yi es la marca de clase de la categoría i-ésima, ni la


frecuencia absoluta de la i-ésima clase y k es el número de
categorías.

33

También podría gustarte