Muestreo Probabilístico Exposicion

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 10

Muestreo Probabilístico

Integrantes:
-Barrientos Melendez Roger Antony
-Francia Francia Rosario de los Ángeles
-Ingaruca Minaya Andrea Elizabeth
-Rodas Herbas Marlene
-Quiquia Uchuipoma Amber Esthefany
Profesor:
Huarhua Contreras Eustaquio
Curso:
Estadística
Carrera:
Administración de Empresas

Muestreo probabilístico
Analizar y estudiar una población estadística, utilizando la selección aleatoria.

¿Qué es la muestreo probabilístico?


El muestreo probabilístico es un tipo de muestra estadística que se centra en analizar y
estudiar grupos específicos de una población estadística, utilizando la selección
aleatoria.
Su requisito principal consiste en que todas las personas de la población estudiada,
cuenten con las mismas oportunidades de selección. 
Tipos de muestreo probabilístico
El muestreo probabilístico puede clasificarse en muestreo aleatorio simple,
sistemático, estratificado y muestreo por conglomerados. 

1.- Muestreo Aleatorio Simple

La selección de la muestra se realiza en una sola etapa, directamente y sin


reemplazamientos.

El muestreo aleatorio simple, tal y como su nombre lo indica, es un método


completamente aleatorio que se utiliza para seleccionar una muestra. Este método de
muestreo es tan fácil como asignar números a los individuos (muestra) y luego elegir
de manera aleatoria números entre los números a través de un proceso automatizado.
Finalmente, los números que se eligen son los miembros que se incluyen la muestra.

2. Muestra sistemática. 
Si la razón que se pretende es 1/n, empezamos escogiendo el primer elemento al azar
entre los primeros n objetos de la población, y tras ello extraemos cada n-avo objeto.
Si tenemos una lista de objetos de la población el procedimiento será muy fácil incluso
sin una computadora, y el resultado será así representativo, excepto en la situación
inusual que una característica importante de los casos sucede a la repetición en
cada n casos
Propiedades del muestreo sistemático

✔ Ventajas 
- Obtiene buenas propiedades de representatividad, similares a la de un muestreo
aleatorio simple o incluso superiores, pero de forma más rápida y simple, al evitar la
necesidad de generar tantos números aleatorios como individuos en la muestra.
- Respecto al muestreo aleatorio, el muestreo sistemático puede garantizarnos una
selección perfectamente equitativa de la población. Esto puede ser de utilidad si se
distinguen grupos dentro de universo, lo que nos podría evitar la necesidad de usar
estratos. Si existe diferente varianza entre los individuos de los fragmentos, este
muestreo puede ser mejor que el aleatorio. Lo veremos luego.

✘ Desventajas
- Sólo existe la ya mencionada posibilidad de que el orden en que se han listado los
candidatos a la muestra tenga algún tipo de periodicidad oculta que coincida con el
intervalo escogido para generar la muestra sistemática. En este caso, podríamos
generar una muestra sesgada.

3. Muestreo estratificado proporcionado


Cuando dividimos una población en estratos, es habitual que el tamaño de dichos
estratos sea diferente. Por ejemplo, si queremos estudiar el tanto por ciento de la
población que fuma en México y pensamos que la edad puede ser un buen criterio
para estratificar (es decir, pensamos que existen diferencias importantes en el hábito
de fumar dependiendo de la edad), podemos definir 3 estratos: menores de 20 años,
de 20 a 44 años y mayores de 44 años. Es de esperar que al dividir toda la población
mexicana en estos 3 estratos no resulten grupos de igual tamaño. Efectivamente, si
miramos datos oficiales, obtenemos:
* Estrato 1 - Población Mexicana menor de 19 años: 42,4 millones (41,0%)
* Estrato 2 - Población Mexicana de 20 a 44 años: 37,6 millones (36,3%)
* Estrato 3 - Población Mexicana mayor de 44 años: 23,5 millones (22,7%)
Si usamos muestreo estratificado proporcionado, la muestra deberá tener estratos
que guarden las mismas proporciones observadas en la población. Si en este ejemplo
queremos crear una muestra de 1.000 individuos, los estratos tendrán que tener un
tamaño como sigue:
 
Muestra
Estrato Población Proporción
proporcional

1 42,4M 41,0% 410

2 37,6M 36,3% 363

3 23,5M 22,7% 227

2. Muestreo estratificado uniforme 


Hablaremos de una afijación uniforme cuando asignamos el mismo tamaño de
muestra a todos los estratos definidos, sin importar el peso que tienen esos estratos
en la población. Siguiendo con el ejemplo anterior, un muestreo estratificado uniforme
definiría la siguiente muestra por estrato:
 
Muestra
Estrato Población Proporción
uniforme

1 42,4M 41,0% 334

2 37,6M 36,3% 333

3 23,5M 22,7% 333

Como puedes ver, el tamaño de la muestra es igual en todos los estratos (salvo
pequeñas diferencias debidas al redondeo necesario fruto de dividir 1,000 entre 3), en
lugar de seguir las proporciones de la población.
Esta técnica favorece los estratos que tienen menos peso en la población,
equiparándolos en importancia a los estratos más relevantes. Globalmente, reduce la
eficiencia de nuestra muestra (menor precisión en los resultados globales), pero, como
contrapartida, permite estudiar características particulares de todos los estratos con
una precisión mínima mayor. En nuestro ejemplo, si queremos emitir alguna
afirmación específica sobre la población del estrato 3 (mayores de 44 años), podremos
hacerlo con menos error muestral si empleamos una muestra de 333 unidades que si
lo hacemos con una muestra de 227 (como ocurriría en el muestreo estratificado
proporcional).
Muestreo estratificado óptimo (respecto a la desviación estándar)
En este caso, el tamaño de los estratos en la muestra no guarda proporcionalidad con
la población. Por el contrario, se trata de optimizar el tamaño muestral de cada estrato
con el fin de reducir el margen de error global, teniendo en cuenta no solo el tamaño
de cada estrato en la población sino su desviación estándar.
Esta optimización lo que hace, básicamente, es dedicar más unidades de muestra de
las que corresponderían en un muestreo proporcional a aquellos estratos que tienen
más variabilidad y que por lo tanto son más difíciles de estimar.
La forma exacta en que se calcula el tamaño óptimo de muestra por estrato es un tema
un poco más técnico, pero tienes una explicación detallada en este post, por si eres de
los que les gusta la estadística.
 
Eficiencia de los diferentes muestreos estratificados
Las preguntas inevitables son: ¿cuándo conviene emplear la estratificación?, ¿qué tipo
de estratificación es más conveniente?
El muestreo estratificado proporcional produce siempre menor o igual error muestral
que el muestreo aleatorio simple, es decir, es más preciso. La igualdad se produce
cuando las medias o las proporciones que estamos analizando son iguales en todos los
estratos. Por lo tanto, la estratificación produce más beneficio cuanto más diferentes
sean los estratos entre sí.
El muestreo estratificado óptimo es siempre igual o más preciso que el muestreo
estratificado proporcional. Ambos métodos son igual de precisos cuando las
desviaciones típicas dentro de cada estrato son iguales, en cuyo caso ambos métodos
son totalmente equivalentes. Por lo tanto, la estratificación óptima produce más
beneficio cuanto más diferencias existan entre las desviaciones dentro de cada grupo,
situación en la que podremos reducir el tamaño muestral de los grupos más
homogéneos en beneficio de los más heterogéneos. Como contrapartida, es un
método más complejo y que requiere tener mucha información a priori de la muestra
que estudiamos, algo que normalmente no tenemos (rara vez conocemos las
desviaciones típicas de los universos que vamos a investigar).
 Tamaños de muestra requeridos por cada técnica
Las técnicas de muestreo estratificado pueden emplearse para estimar de forma más
precisa parámetros de las poblaciones de interés, ya sean medias (p.e. media de
cigarrillos consumidos por los fumadores de México) o proporciones (p.e. proporción
de la población de México que fuma). Pero, inversamente, también pueden
permitirnos reducir el tamaño de muestra requerido para lograr una estimación con un
nivel de error determinado.
La siguiente tabla resume el tamaño de muestra requerido al emplear cada técnica, en
función del error máximo que estamos dispuestos a aceptar (e) y de las características
del propio universo. En estas fórmulas consideramos que el universo es de tamaño
infinito. Si fuese finito, debe aplicarse un factor de corrección.

Para interpretar el cuadro anterior es necesario tener en cuenta lo siguiente:


- Z es el valor crítico de corte de una distribución normal para lograr un nivel de
confianza deseado. Tienes más información sobre el significado de Z aquí. Los valores
más frecuentes son:
Nivel de confianza 90% -> Z=1,645
Nivel de confianza 95% -> Z=1,96
Nivel de confianza 99% -> Z=2,575
- L es el número de estratos en que particionamos la muestra y h es un índice que se
refiere a un estrato concreto. Por lo tanto, h puede variar entre 1 y L estratos.
- p es la proporción que buscamos en el total de la población (p.e. % de fumadores).
Por lo tanto, (1-p) es la proporción  complementaria, la que no cumple el criterio
buscado (% de no fumadores). Del mismo modo, ph es dicha proporción dentro de
cada uno de los estratos.
- σ2 es la varianza del dato buscado (en el caso de estimar medias) en el total de la
población. Asimismo, σh2 es la varianza dentro de cada estrato.
- e es el margen de error aceptado.
- Wh es el peso que el estrato tiene en la muestra (tamaño del estrato respecto al total
de la muestra). Si hablamos de estratificación proporcional, cada Wh es igual a la
proporción que ese estrato representa en la población. Si hablamos de estratificación
óptima, cada Wh se calcula en función de la dispersión dentro de cada estrato.

Es posible demostrar a partir de las fórmulas anteriores que los diferentes métodos de
estratificación sólo reducen el tamaño de la muestra necesaria si los valores
de p y σ varían entre estratos. De lo contrario, todas las expresiones son equivalentes.
Veamos un ejemplo: si tomamos la expresión de tamaño de muestra requerido para
estimar una media mediante un muestreo estratificado óptimo, tenemos 
n = Z2 
(L∑h=1 wh σh )2e2
Si consideramos que todas las varianzas de los estratos son iguales (σ h=σ) y que el
tamaño de los estratos es idéntico (Wh=1/L), el resultado que obtenemos es
n = Z2 
(L∑h=1 wh σh )2e2
 = Z2 
(L∑h=1 (1/L)σ )2e2
 = Z2 
((L/L)σ)2e2
 = Z2 
σ2e2
que coincide con el tamaño de muestra necesario para tener un error máximo e en un
muestreo aleatorio simple.
 
Conclusiones
El muestreo estratificado es una técnica que nos permite reducir el error en nuestras
estimaciones siempre y cuando tengamos cierta información a priori sobre la
existencia de grupos homogéneos en la población. Esperamos que este post te haya
ayudado a aclarar la utilidad de este método. En próximos posts abordaremos el
muestreo sistemático.
 

4. Muestra aleatoria ponderada. 


Cuando la población incluye un grupo muy pequeño pero
esencial, hay el riesgo de que ningún miembro de ese grupo
quede dentro de una muestra aleatoria. Tales grupos claves de
usuarios de productos son, entre otros, gente corto de vista,
duro de oído o con la capacidad reducida del movimiento, véase
una lista de tal gente. Otras minorías a menudo significativas originan de religiones, de
nacionalidades y de lenguas.
Para asegurar por lo menos algunos de una minoría clave (marcada con x en el
diagrama a la derecha) en la muestra, podemos incrementar deliberadamente
la razón de la muestra sobre este grupo de especial importancia. Por supuesto que
esto generará un desequilibrio en las mediciones que se obtengan a partir de la
muestra ponderada, pero será fácil restaurar el equilibro original. Esto se hace así
cuando se combinan los resultados; por ejemplo, al calcular la media de todas las
mediciones daremos a las mediciones de cada grupo su peso apropiado
correspondiente a los porcentajes genuinos en la población.

5.-Muestreo probabilístico: muestreo por conglomerados


Con este post dedicado al muestreo por conglomerados cerramos el primer gran
bloque de posts dedicados al muestreo probabilístico. A partir de la próxima publicación
abordaremos técnicas de muestreo no probabilístico, las más habituales cuando
hablamos de investigación online.
El muestreo por conglomerados es una técnica que aprovecha la existencia de grupos
o conglomerados en la población que representan correctamente el total de la
población en relación a la característica que queremos medir. Dicho de otro modo,
estos grupos contienen toda la variabilidad de la población. Si esto sucede, podemos
seleccionar únicamente algunos de estos conglomerados para conocer la información
de interés del total de la población.
Podemos ver esta técnica desde otro punto de vista. Mientras que en todas las
técnicas vistas hasta ahora las unidades de muestreo coinciden con las unidades a
estudiar (individuos), en el muestreo por conglomerados las unidades de muestreo son
grupos de unidades a estudiar (grupos de individuos), algo que puede resultar muy
beneficioso en términos de coste. A cambio, es habitual obtener una menor precisión
al usar esta técnica, causada por falta de heterogeneidad dentro de los
conglomerados.
  El proceso de muestreo

El primer paso para aplicar esta técnica es definir los conglomerados. Se trata de
identificar una característica que permita dividir la población en grupos disjuntos (sin
solapamiento) y de forma exhaustiva (todos los individuos deben estar en un grupo),
de tal manera que los grupos no difieran entre sí en relación a aquello que queremos
medir. Una vez hemos definido estos conglomerados, seleccionaremos al azar algunos
de ellos para estudiarlos.
Un criterio habitual para definir conglomerados es el geográfico. Por ejemplo, si
queremos estudiar qué proporción de la población argentina fuma, podemos dividir el
total de la población en provincias y seleccionar algunas de ellas para ser estudiadas. Si
no tenemos razones de peso para pensar que el porcentaje de fumadores va a cambiar
de una provincia a otra, esta solución nos permitirá concentrar el esfuerzo de
muestreo en un único entorno geográfico. Si el estudio se va a hacer mediante
entrevistas personales, esto representa un importante ahorro de costes de
desplazamientos.
Una vez definimos los conglomerados, el siguiente paso es seleccionar los
conglomerados a estudiar, ya sea mediante un muestreo aleatorio simple o
sistemático.
Por último, una vez seleccionados los conglomerados a estudiar, podemos investigar a
todos los sujetos que forman parte de los mismos, o bien aplicar un nuevo proceso de
muestreo dentro del conglomerado, por ejemplo obteniendo una muestra mediante
muestreo aleatorio simple o sistemático. Si optamos por esta posibilidad, estaremos
hablando de un muestreo en dos etapas o bietápico: la primera etapa será la selección
del conglomerado; la segunda, la de individuos dentro del conglomerado. Si por el
contrario estudiamos todos los individuos del conglomerado, hablaremos de muestreo
por conglomerados unietápico.
 
Muestreo estratificado y muestreo por conglomerados
La idea del muestreo por conglomerados recuerda a la del muestreo estratificado. En
ambos casos dividimos la población en grupos. Sin embargo, los principios detrás de
ambas técnicas son en cierto modo opuestos.
El muestreo estratificado es especialmente adecuado cuando los grupos (estratos) son
muy homogéneos internamente y muy diferentes entre sí. En ese caso, conviene
asegurar que tenemos representantes en nuestra muestra que provienen de todos los
estratos. Por el contrario, el muestreo por conglomerados es muy adecuado cuando
los grupos en que dividimos la población son muy similares entre sí, por lo que no hay
gran diferencia entre estudiar individuos de un grupo o de otro.
Es por ello que pese a que ambas técnicas dividen la población en estratos o
conglomerados, el proceso de selección de individuos es radicalmente diferente.
 
Ventajas y desventajas del muestreo por conglomerados

✔ La principal ventaja de esta técnica es de tipo operativa: seleccionar un


conglomerado a estudiar suele ser más fácil y económico que hacer una muestra
aleatoria o sistemática. Hemos visto por ejemplo que usar conglomerados geográficos
puede representar un importante ahorro en desplazamientos de personas.
Curiosamente, es habitual hacer estudios a través de Internet en los que se sigue
pensando en términos de estudiar sólo unas zonas geográficas, cuando en realidad a
través de Internet no obtenemos ningún beneficio operativo; al contrario, incurrimos
en mayor riesgo de tener menor precisión por diferencias entre las regiones
estudiadas y el resto de la población. Esta práctica es una herencia injustificada de
técnicas que eran buenas en entrevistas personales, pero que no lo son al usar otras
metodologías.

✘ Como principal inconveniente, al usar muestreo por conglomerados corremos un


riesgo importante: que los conglomerados no sean realmente homogéneos entre ellos.
En el ejemplo anterior sobre fumadores en Argentina, podría suceder que en una de
las provincias exista más propensión a fumar, por ser una región más urbana, por
razones culturales, etc.

También podría gustarte