Muestreo Probabilístico

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 7

Muestreo probabilístico:

muestreo estratificado
Vimos en un post anterior la definición, ventajas e inconvenientes del
muestreo aleatorio simple. Veamos ahora el muestreo estratificado.

Esta técnica, perteneciente a la familia de muestreos probabilísticos, consiste


en dividir toda la población objeto de estudio en diferentes subgrupos o
estratos disjuntos, de manera que un individuo sólo puede pertenecer a un
estrato. Una vez definidos los estratos, para crear la muestra se seleccionan
individuos empleando una técnica de muestreo cualquiera a cada uno de los
estratos por separado. Si por ejemplo empleamos muestreo aleatorio simple en
cada estrato, hablaremos de muestreo aleatorio estratificado (M.A.E. en
adelante). Del mismo modo, podríamos usar otras técnicas de muestreo en
cada estrato (muestreo sistemático, aleatorio con reposición, etc.).

Los estratos suelen ser grupos homogéneos de individuos, que a su vez son
heterogéneos entre diferentes grupos. Por ejemplo, si en un estudio esperamos
encontrar un comportamiento muy diferente entre hombres y mujeres, puede
ser conveniente definir dos estratos, uno por cada sexo. Si la selección de
estos estratos es correcta (1) los hombres deberían comportarse de forma
parecida entre ellos, (2) las mujeres deberían comportarse de forma muy
similar entre ellas y (3) hombres y mujeres deberían mostrar comportamientos
dispares entre sí.

Si la anterior condición se cumple (estratos homogéneos internamente,


heterogéneos entre sí) el uso del muestreo aleatorio estratificado reduce el
error muestral, mejorando la precisión de nuestros resultados al realizar un
estudio sobre la muestra.

Es relativamente habitual definir estratos de acuerdo a algunas variables


características de la población como son la edad, sexo, clase social o región
geográfica. Estas variables permiten dividir fácilmente la muestra en grupos
mutuamente excluyentes y con bastante frecuencia, permiten discriminar
comportamientos diferentes dentro de la población.

Tipos de muestreo estratificado

Dependiendo del tamaño que asignamos a los estratos, hablaremos de


diferentes tipos de muestreo estratificado. También se acostumbra a hablar de
diferentes formas de "afijación" de la muestra en estratos.

(1) Muestreo estratificado proporcionado

Cuando seleccionamos una característica de los individuos para definir los


estratos, suele ocurrir que el tamaño de las subpoblaciones resultantes en el
universo son diferentes. Por ejemplo, queremos estudiar el % de la población
que fuma en México y pensamos que la edad puede ser un buen criterio para
estratificar (es decir, pensamos que existen diferencias importantes en el
hábito de fumar dependiendo de la edad). Definimos 3 estratos: menores de
20 años, de 20 a 44 años y mayores de 44 años. Es de esperar que al dividir
toda la población mexicana en estos 3 estratos no resulten grupos de igual
tamaño. Efectivamente, si miramos datos oficiales, obtenemos:

* Estrato 1 - Población Mexicana menor de 19 años: 42,4 millones (41,0%)

* Estrato 2 - Población Mexicana de 20 a 44 años: 37,6 millones (36,3%)

* Estrato 3 - Población Mexicana mayor de 44 años: 23,5 millones (22,7%)

Si usamos muestreo estratificado proporcionado, la muestra deberá tener


estratos que guarden las mismas proporciones observadas en la población. Si
en este ejemplo queremos crear una muestra de 1.000 individuos, los estratos
tendrán que tener un tamaño como sigue:
Estrato Población Proporción Muestra
1 42,4M 41,0% 410
2 37,6M 36,3% 363
3 23,5M 22,7% 227

(2) Muestreo estratificado uniforme


Hablaremos de una afijación uniforme cuando asignamos el mismo tamaño
de muestra a todos los estratos definidos, sin importar el peso que tienen esos
estratos en la población. Siguiendo con el ejemplo anterior, un muestreo
estratificado uniforme definiría la siguiente muestra por estrato:
Estrato Población Proporción Muestra
1 42,4M 41,0% 334
2 37,6M 36,3% 333
3 23,5M 22,7% 333

Esta técnica favorece los estratos que tienen menos peso en la población,
equiparándolos en importancia a los estratos más relevantes. Globalmente,
reduce la eficiencia de nuestra muestra (menor precisión en los resultados),
pero como contrapartida permite estudiar características particulares de cada
estrato con mayor precisión. En nuestro ejemplo, si queremos emitir alguna
afirmación específica sobre la población del estrato 3 (mayores de 44 años),
podremos hacerlo con menor nivel de error muestral si empleamos una
muestra de 333 unidades que si lo hacemos con una muestra de 227 (como
ocurría en el muestreo estratificado proporcional).

(3) Muestreo estratificado óptimo (respecto a la desviación estándar)

En este caso, el tamaño de los estratos en la muestra no guardará


proporcionalidad con la población. Por el contrario, se define el tamaño de los
estratos proporcionalmente a la desviación estándar de las variables objeto de
estudio. Es decir, se toman estratos de mayor tamaño en los estratos con
mayor variabilidad interna para representar mejor en el total de la muestra los
grupos poblacionales más difíciles de estudiar.

Eficiencia de los diferentes muestreos estratificados

Las preguntas inevitables son: ¿cuando conviene emplear la estratificación?,


¿qué tipo de estratificación es más conveniente?

 El muestreo estratificado proporcional produce siempre menor o igual error


muestral que el muestreo aleatorio simple, es decir, es más preciso. La igualdad se
produce cuando las medias o las proporciones que estamos analizando son iguales en
todos los estratos. Por lo tanto, la estratificación produce más beneficio cuanto más
diferentes sean los estratos entre sí.
 El muestreo estratificado óptimo es siempre igual o más preciso que el muestreo
estratificado proporcional. Ambos métodos son igual de precisos cuando las
desviaciones típicas dentro de cada estrato son iguales, en cuyo caso ambos métodos
son totalmente equivalentes. Por lo tanto, la estratificación óptima produce más
beneficio cuanto más diferencias existan entre las desviaciones dentro de cada grupo,
situación en la que podremos reducir el tamaño muestral de los grupos más
homogéneos en beneficio de los más heterogéneos. Como contrapartida, es un
método más complejo y que requiere tener mucha información a priori de la muestra
que estudiamos, algo que normalmente no tenemos.

Tamaños de muestra requeridos por cada técnica


Vemos que la estratificación puede proporcionar beneficios. Si estas técnicas
pueden emplearse para estimar de forma más precisa ya sean medias (p.e.
media de cigarrillos consumidos por los fumadores de México) o proporciones
(p.e. proporción de la población de México que fuma), también pueden
permitirnos reducir el tamaño de muestra requerido para lograr una estimación
con un nivel de error determinado.

La siguiente tabla resume el tamaño de muestra requerido al emplear cada


técnica, en función del error máximo que estamos dispuestos a aceptar y de las
características del propio universo, que consideraremos de tamaño infinito (si
fuese finito, debe aplicarse un factor de corrección).

Para interpretar el cuadro anterior es necesario tener en cuenta lo siguiente:

 Z = Es la desviación del valor medio que aceptamos para lograr el nivel de confianza
deseado. En función del nivel de confianza que busquemos, usaremos un valor
determinado que viene dado por la forma que tiene la distribución de Gauss. Los
valores más frecuentes son:

Nivel de confianza 90% -> Z=1,645

Nivel de confianza 95% -> Z=1,96

Nivel de confianza 99% -> Z=2,575


 L es el número de estratos en que particionamos la muestra y h es un índice que se
refiere a un estrato concreto. Por lo tanto, h puede variar entre 1 y L estratos.
 p es la proporción que buscamos en el total de la población (p.e. % de fumadores).
Por lo tanto, (1-p) es la proporción de la muestra complementaria, la que no cumple
el criterio buscado (no fumadores). Del mismo modo, ph es dicha proporción dentro
de cada uno de los estratos.
 σ2 es la varianza que el dato buscado (en el caso de estimar medias) tiene en el total
de la población. Asimismo, σh2 es la varianza dentro de cada estrato.
 e es el margen de error aceptado.
 Wh es el peso que el estrato tiene en la muestra (tamaño del estrato respecto al total
de la muestra). Si hablamos de estratificación proporcional, cada Wh es igual a la
proporción que ese estrato representa en la población. Si hablamos de estratificación
óptima, cada Wh se calcula en función de la dispersión dentro de cada estrato.
Es posible demostrar a partir de las fórmulas anteriores que los diferentes
métodos de estratificación sólo reducen el tamaño de la muestra si los valores
de p y σ varía entre estratos. De lo contrario, todas las expresiones son
equivalentes. Veamos un ejemplo: si tomamos la expresión de tamaño de
muestra requerido para estimar una media mediante un muestreo estratificado
óptimo (ignorando el parámetro Z en este caso)

y consideramos que todas las varianzas de los estratos son iguales (σh=σ) y
que el tamaño de los estratos es idéntico (Wh=1/L), el resultado que
obtenemos es

Esperamos que este post ayude a aclarar la utilidad del muestreo estratificado.
En próximos posts abordaremos el muestreo sistemático.
ÍNDICE: Serie Muestreo
1. El muestreo: qué es y por qué funciona
2. Muestreo probabilístico o no probabilístico
3. Muestreo probabilístico: muestreo aleatorio simple
4. Muestreo probabilístico: muestreo estratificado
5. Muestreo probabilístico: muestreo sistemático
6. Muestreo probabilísitico: muestreo por conglomerados
7. Muestreo no probabilístico: muestreo por conveniencia
8. Muestreo no probabilístico: muestreo por cuotas
9. Muestreo no probabilístico: muestreo por bola de nieve

También podría gustarte