Matemática
Matemática
Matemática
Tipos de estadística
Los tipos de estadística se puede subdividir en dos grandes ramas: descriptiva e
inferencial.
Estadística descriptiva: Se refiere a los métodos de recolección, organización,
resumen y presentación de un conjunto de datos. Se trata principalmente de
describir las características fundamentales de los datos y para ellos se suelen
utilizar indicadores, gráficos y tablas.
Estadística inferencial: Se trata de un paso más allá de la mera descripción. Se
refiere a los métodos utilizados para poder hacer predicciones, generalizaciones
y obtener conclusiones a partir de los datos analizados teniendo en cuenta el
grado de incertidumbre existente.
La estadística inferencial se subdivide a su vez en dos grandes tipos: estadística
paramétrica y no paramétrica.
Estadística paramétrica: Se caracteriza porque asume que los datos tienen una
determinada distribución o se especifican determinados parámetros que deberían
cumplirse. Así por ejemplo, en un análisis paramétrico podemos trabajar bajo el
supuesto de que la población se distribuye como una Normal (hay que justificar
nuestro supuesto) y luego sacar conclusiones bajo el supuesto que esta condición
se cumple.
Estadística no paramétrica: En ella no es posible asumir ningún tipo de
distribución subyacente en los datos ni tampoco un parámetro específico. Un
ejemplo de este tipo de análisis es la prueba binomial.
Elementos de la estadística
Los principales elementos de la estadística son:
Población: Grupo de individuos que presenta o podría presentar un rasgo
característico común que se desea investigar.
Muestra: Es un subgrupo de datos extraídos de una población que debe
representar adecuadamente la totalidad del grupo.
Parámetros: Son medidas que ofrecen información sobre el centro de un
conjunto de datos (medidas de tendencia central), otras sobre la dispersión o
variabilidad (medidas de dispersión) y otras sobre la posición de un valor
(medidas de posición como los percentiles).
Experimento: Proceso o actividad llevada a cabo de forma intencional para
obtener una serie de datos o para ratificar o refutar una hipótesis.
Variable: La característica o cualidad de una muestra o población a la cual se le
puede asignar un valor.
Población
Quizá, la definición teórica de población estadística sea un poco abstracta. Por eso, sin
renunciar a la rigurosidad y precisión que requieren las variables cuantitativas, vamos a
intentar abordar el concepto de población estadística de la forma más sencilla posible.
Empezaremos por la palabra población. ¿En qué piensas cuando lees o escuchas la
palabra población? Muy probablemente en un número de personas. Por ejemplo, la
población de Argentina, la población de Chile, la población de Nueva York o la
población mundial. Y dirás, ¿qué tiene que ver la población con la estadística? Pues
tiene que ver mucho. Todo se remonta a los orígenes de la palabra estadística.
Con esto en mente, seguiremos la siguiente secuencia para entender el concepto: origen
de la palabra, principales tipos de población y un ejemplo de población estadística.
Inferencia estadística
Una vez obtenidos tenemos la muestra representativa, entonces toca inferir ciertas
métricas. A menudo, lo que nos interesa es saber cierta medida de una variable. En el
ejemplo inicial, la variable sería el salario de los ciudadanos de un país. En este sentido,
la métrica que queremos analizar es la media del salario de los ciudadanos de un país.
Es decir, tenemos una población de datos formada por todos los trabajadores de México.
De dicha población obtenemos una variable, es decir, el salario anual. Utilizando las
técnicas adecuadas obtenemos una muestra representativa. Y, por último, una vez
tenemos un conjunto de datos con el que podemos trabajar utilizamos técnicas
de inferencia estadística para calcular el salario medio.
Por supuesto, una vez tenemos el conjunto de datos, podríamos inferir otras medidas.
Por ejemplo, cómo se distribuye el salario, qué porcentaje de trabajadores se encuentra
por debajo de cierto salario o de qué tamaño es la brecha salarial.
Ejemplo de muestra estadística
Supongamos que queremos realizar un estudio sobre el gasto medio de las familias de
Colombia en el mes de enero. Para ello tenemos dos opciones:
-Entrar en las cuentas bancarias de todas las familias de Colombia
-Preguntar a una cantidad de personas representativa
La primera opción no es viable por varias razones. Primero que las familias no van a
ceder sus datos y segundo que tampoco podíamos ir familia por familia mirando los
datos. Principalmente, porque la población de Colombia se encuentra cerca de los 50
millones. Mientras, la segunda es la opción para recoger una muestra estadística.
Lo que haremos, siguiendo las características mencionadas anteriormente, será
preguntar a 100.000 familias. Es algo complicado pero mucho más fácil que preguntar a
50 millones de colombianos. La diferencia es considerable. Así pues, a partir de esa
muestra de 100.000 familias, intentaremos calcular el gasto medio de las familias en
enero.
Los datos extraídos serán más o menos fiables según una serie de métricas que se tienen
en cuenta en las investigaciones estadísticas. Claro que, ese tipo de métricas son más
avanzadas y, por ello, no las trataremos aquí.
Otro ejemplo de muestra estadística podría ser conocer la opinión de la gente de un
determinado barrio acerca de que se cree un restaurante de comida mexicana en la zona
en la que residen. Las opciones para realizar este muestreo pueden ser consultarle a la
gente en la calle para saber si irían a comer o cenar a este nuevo restaurante.
En cambio, otra opción sería que nuestro grupo de amigos enviase entre sus grupos de
conocidos un cuestionario consultando esta información. La gente que respondiese sería
la muestra.
Parámetro
En estadística, el parámetro estadístico es un valor, un número, que resume y permite
interpretar los datos extraídos en el estudio de una muestra estadística. Imaginemos que
hablamos de una población determinada que queremos analizar. En este caso, el
parámetro estadístico podría ser la edad media de la población en cuestión.
También, es conveniente señalar que a los parámetros estadísticos también se les conoce
como estadísticos descriptivos.
Medidas de dispersión
Las medidas de dispersión son, en esencia, un valor numérico que ofrece información
sobre el grado de variabilidad de una variable.
Dentro de las medidas de dispersión, podemos encontrar las medidas de dispersión
absoluta y las medidas de dispersión relativas.
Veamos, a continuación, las dos.
Medidas de dispersión absolutas
Las medidas de dispersión absolutas vienen dadas en las mismas unidades en las que se
mide la variable.
En este sentido, hablamos de medidas como las desviaciones medias, la varianza, o
la desviación típica.
En el caso de la desviación típica, por ejemplo, esta ofrece información de la dispersión
respecto a la media. De la misma forma, la varianza representa la variabilidad de una
serie de datos respecto a su media.
Medidas de dispersión relativas
Las medidas de dispersión relativas nos informan de la dispersión, como las de
dispersión absolutas, pero lo hacen en términos relativos, es decir, como un porcentaje.
Entre las principales medidas de dispersión relativas que conocemos, destacan
el coeficiente de variación, el índice de desviación respecto de la mediana, entre otras.
En el caso del coeficiente de variación, este nos informa sobre si una variable se mueve
mucho o poco, aunque ello, con relación a otra variable. Mientras la varianza nos indica
la variación absoluta de una serie de datos, el coeficiente de variación nos indica dicha
variación, pero con relación a otra variable, por lo que hablamos de términos relativos.
Variable
Una variable estadística es una característica de una muestra o población de datos que
puede adoptar diferentes valores.
Cuando hablamos de variable estadística estamos hablando de una cualidad que,
generalmente adopta forma numérica. Por ejemplo, la altura de Juan es de 180
centímetros. La variable estadística es la altura y está medida en centímetros.
También podríamos, por ejemplo, decir que el beneficio de una empresa ha sido de
22.300 dólares el último año. En este caso, la variable sería el beneficio y estaría
medido en dólares. Ambas variables son del tipo cuantitativo (se expresan con un
número)
Claro que no todas las variables estadísticas son iguales y, por supuesto, no todas se
pueden (en principio) expresar en forma de número. Así, otra variable que podríamos
encontrarnos es el color de ojos de una persona. Por ejemplo, Juan tiene los ojos verdes
y Andrés los tiene azules. La variable sería el color de ojos y sería una variable
cualitativa. Es decir, no se expresa con número
Tipos de variables estadísticas
Aunque hay decenas de tipos de variables estadísticas, por norma general podemos
encontrarnos dos tipos de variables:
Variable cuantitativa: Son variables que se expresan numéricamente.
Variable continua: Toman un valor infinito de valores entre un intervalo de
datos. El tiempo que tarda un corredor en completar los 100 metros lisos.
Variable discreta: Toman un valor finito de valores entre un intervalo de datos.
Número de helados vendidos.
Variable cualitativa: Son variables que se expresan, por norma general, en
palabras.
Variable ordinal: Expresa diferentes niveles y orden.
Variable nominal: Expresa un nombre claramente diferenciado. Por ejemplo el
color de ojos puede ser azul, negro, castaño, verde, etc.
Además cada una de estas variables podría tener más subtipos, ya que tenemos variables
de tipo económico, categóricas, dicotómicas, dependientes, independientes y cardinales.
Es decir, como ya hemos dicho, muchos tipos de variables estadísticas. Por ejemplo,
podríamos tener una variable estadística de tipo cuantitativo, discreta y dependiente.
Adicionalmente, también debemos aclarar que el hecho que las variables cualitativas se
expresen con nombre no quiere decir que no puedan ser parte de un modelo matemático.
Así pues, podríamos crear una variable cuantitativa a partir de una variable cualitativa.
Por ejemplo, para el color de ojos podríamos asignar un 1 si tiene los ojos azules, un 2
si tiene los ojos verdes y un 3 si tiene los ojos marrones. O, en otros casos, podríamos
también convertir variables dicotómicas que indica SI o NO, en 1 o 0.
Ejemplos de variable estadística
A continuación, mostramos un ejemplo de cada una de los tipos de variable estadística:
Ejemplo variable cuantitativa
Un ejemplo de variable cuantitativa serían las horas que trabaja un empleado a lo largo
de la semana. Otro ejemplo podría ser el número de kilómetros que realiza un ciclista
profesional a lo largo de la temporada.
Ejemplo de variable continua
Las variables continuas son aquellas que toman valores infinitos dentro de un intervalo
como puede ser el tiempo que un corredor tarda en recorrer los 100 metros lisos. Un
ejemplo más puede ser el peso de un paquete de espaguetis.
Ejemplo de variable discreta
Podríamos mencionar el número de helados vendidos en una heladería o el número de
clases que da un profesor a lo largo del curso lectivo.
Ejemplo de variable cualitativa
Los asistentes a un concierto que tienen entradas diferenciadas por la zona en la que se
ubiquen como pista, grada o zona VIP sería una variable cualitativa.
Ejemplo de variable ordinal
Escalas de medición
¿Qué tipos de escalas de medición existen?
En estadística, existen cuatro tipos de escalas de medición de datos: nominal, ordinal, de
intervalo y de razón. A continuación te detallaremos cada una:
Escala nominal
La escala nominal se utiliza para etiquetar variables sin ningún valor cuantitativo, son
mutuamente excluyentes (no se superponen) y ninguna de ellas tiene significado
numérico.
Una buena manera de recordar todo esto es que «nominal» suena mucho como
«nombre» y las escalas nominales son algo así como «nombres» o etiquetas.
Escala ordinal
En la escala ordinal, lo importante y significativo es el orden de los valores, pero no se
conocen realmente las diferencias entre cada uno de ellos.
«Ordinal» es fácil de recordar porque suena como «orden» y esa es la clave que hay que
recordar con las «escalas ordinales»: lo que importa es el orden, pero eso es todo lo que
se obtiene de ellas.
Escala de Intervalo
La escala de intervalo es una escala numérica en la que conocemos tanto el orden como
las diferencias exactas entre los valores.
El ejemplo clásico de una escala de intervalo es la temperatura Celsius debido a que la
diferencia entre cada valor es la misma.
Las escalas de intervalo son agradables porque se abre el ámbito del análisis
estadístico de estos conjuntos de datos. Por ejemplo, la tendencia central puede medirse
mediante la media, la mediana y la moda; también puede calcularse la desviación
estándar.
Al igual que los demás, puedes recordar los puntos clave de una escala de intervalo con
bastante facilidad. «Intervalo» significa en sí mismo «espacio intermedio», que es lo
importante a recordar: las escalas de intervalo no sólo nos hablan del orden, sino
también del valor entre cada elemento.
Escalas de razón
La escala de razón arroja el valor exacto entre las unidades y también tienen un cero
absoluto, lo que permite aplicar una amplia gama de estadísticas tanto descriptivas
como inferenciales.
Todo lo anterior sobre los datos de intervalo se aplica a las escalas de razón, y además
las escalas de razón tienen una clara definición de cero.
La escala de razón o escala proporcional ofrece una gran cantidad de posibilidades en lo
que respecta al análisis estadístico. Estas variables pueden sumarse, restarse,
multiplicarse y dividirse de forma significativa.