E2 Unidad 2 Muestreo Estimación

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 5

Facultad Integral del Norte – U.A.G.R.M.

Materia: MAT-260, Estadística II


Docente: Ing. René Alfredo Ovando Patiño 1

Unidad II: Teoría de Muestreo y de Estimación


El objetivo del muestreo es obtener datos sobre la población de la que se extrae la muestra y por lo
general, dichos datos se utilizan para tomar una decisión respecto a la población. En consecuencia, la
información que proporciona la muestra debe representar, en la forma más precisa posible, la verdadera
naturaleza de toda la población. Tal vez se desee una muestra representativa (una muestra no sesgada),
pero en ocasiones este tipo de muestras es difícil de obtener.

En las muestras puede haber todo tipo de sesgos y algunos se toman con demasiado prejuicio. Es obvio
que si sólo se muestrean las manzanas que están en la parte superior de una canasta, se corre el riesgo de
obtener una muestra no representativa; lo mismo que al muestrear únicamente las unidades fabricadas al
iniciar un lote o corrida, ya que éstos por lo general no son idénticos a los que se fabrican al final. Los
sesgos bastante imperfectos se presentan debido a que las personas que toman la muestra, lo hacen
exclusivamente de una porción de la población en forma descuidada. Por ejemplo, a menudo se obtienen
conclusiones basadas en encuestas telefónicas. Las personas se seleccionan en forma aleatoria del
directorio. Al llamarlas por teléfono se les pregunta algo y se extraen conclusiones basadas en sus
respuestas. Esta muestra es bastante sesgada, debido a que las conclusiones no son necesariamente
representativas de toda la población. Es decir, una porción bastante grande de la población no tiene
teléfono; otra parte sí lo tiene, pero su número no aparece en el directorio, y hay quien tiene más de un
teléfono y en consecuencia, su probabilidad de selección aumenta. Por lo tanto, el método de la encuesta
no es adecuado. Si el investigador, por ejemplo, elimina un número, simplemente porque está ocupado,
las respuestas de las familias con hijos adolescentes que siempre están hablando por teléfono, quedarían
fuera de la muestra. Si se profundiza un poco más al respecto, se encontrarán muchas otras fuentes
posibles de sesgo.

La utilización de las técnicas de muestreo es muy amplia. Se las usa de una manera generalizada en todo
tipo de industrias, en comercios y en servicios; en agricultura y en ganadería; es difícil concebir una
actividad económica en un país, en el cual no se usen este tipo de técnicas. Y, naturalmente, ocurre algo
similar en las diferentes áreas del conocimiento humano: actuaría, antropología, biología, contaduría,
demografía, economía, ingeniería, medicina, mercadotecnia, oceanografía, psicología, publicidad,
sociología, etc. Se les usa para averiguar el valor de un porcentaje, como el formado por las familias
afectadas a una marca de jabón; el valor de una media, como es el número medio de miembros por
familia; el valor de un total; como es el valor total de la producción agrícola de trigo en un lugar
determinado; o para averiguar relaciones del tipo: número total de personas en una ciudad, entre el
número total de personas que tienen seguro de vida en la misma ciudad. Las unidades o elementos que
conforman a la población sujeta a estudio pueden ser de naturaleza diversa, en lugar de hablar de personas
se puede hablar de agrupaciones de ellas, se puede hablar de expedientes, de muebles, de edificios, de
maquinaria industrial, de alimentos enlatados, de caja con fruta fresca, de bodegas, de registros contables,
de animales o de agrupaciones de ellos, etc.

La población en sí, no es de interés, sino que se la estudia por las características, propiedades o atributos
que posea cada uno de sus elementos y que sea de interés. Así se dice que se está desarrollando “una
encuesta en familias referente a ingresos y al tipo de alimentación”. Aquí, las características a estudiar
Facultad Integral del Norte – U.A.G.R.M.
Materia: MAT-260, Estadística II
Docente: Ing. René Alfredo Ovando Patiño 2

en cada familia son sus ingresos y su tipo de alimentación, habiendo establecido previamente las
definiciones adecuadas de ingreso y de tipo de alimentación por familia.
Dentro de las técnicas de muestreo, tenemos: el muestreo simple casual, el sistemático, el estratificado y
el muestreo por conglomerados.

1. MUESTREO SIMPLE
Es el tipo más simple de muestreo, seleccionamos una muestra de tamaño “n” de tal manera que se
asegure que cada uno de los “N” miembros de la población tiene la misma oportunidad de ser
incluido en la muestra. Una muestra seleccionada de esta manera se denomina irrestricta aleatoria
o muestreo simple. Una manera de sacar una muestra irrestricta aleatoria consiste en enumerar a
cada individuo (si la población es finita), poner los números en pedazos de papel y escoger de éstos
al azar. Un método más conveniente es el de utilizar una tabla de números aleatorios. Esas tablas
contienen listas de dígitos escogidos de manera que cada número entre 0 y 9 tiene igual probabilidad
de aparecer en un punto dado en una columna de un dígito, y cada número de dos dígitos entre 00
y 99 tiene la misma probabilidad de aparecer en un punto dado en una columna de dos dígitos, y así
sucesivamente.

2. MUESTREO SISTEMATICO
Una vez determinado el tamaño de la muestra “n” de la población “N”, entonces determinamos el
coeficiente de extracción, que está dado por k = N/n. Este tipo de muestreo es aconsejable para
procesos industriales continuos (control de producción) donde cada elemento a muestrear será el k-
ésimo elemento producido.

3. MUESTREO ESTRATIFICADO
En múltiples ocasiones resulta posible y conveniente partir o fraccionar a la población original en
subdivisiones de tal naturaleza que ellas formen una partición. En estas condiciones cada unidad
pertenece a una y sólo a una subdivisión y la unión de todas ellas conforma a la población original.
En cuanto al método de selección y en parte al de estimación, a cada una de las subdivisiones se les
trata de manera independiente, aunque el método de estimación las unirá en forma global. A un
esquema de este tipo de le conoce como muestreo estratificado y a cada subdivisión trabajada de
manera independiente se les denomina estrato. Todos los estratos son disjuntos y su unión es igual
a la población original. De cada estrato se selecciona una muestra irrestricta aleatoria. Los
individuos en el conjunto de las muestras constituyen la muestra de toda la población; esto es:

Estrato Número en el estrato Número en la muestra


1 N1 n1
2 N2 n2
3 N3 n3
4 N4 n4
. . .
K Nk nk
TOTAL N n

El muestreo estratificado es ampliamente usado por varios motivos:


(a) desde el punto de vista del método de selección permite trabajar o estudiar a cada estrato por
separado;
Facultad Integral del Norte – U.A.G.R.M.
Materia: MAT-260, Estadística II
Docente: Ing. René Alfredo Ovando Patiño 3

(b) permite derivar estimaciones por estrato o a nivel de estrato y cada una de ellas ser estudiadas
con la precisión solicitada;
(c) las estimaciones así derivadas resultan ser usualmente más precisas que aquellas derivadas
mediante una selección aleatoria;
(d) ayuda a resolver muchos problemas de coordinación del trabajo de campo (desarrollo de
encuestas).

4. MUESTREO POR CONGLOMERADOS


Este tipo de muestreo se realiza en dos etapas y está diseñado para ahorrar recursos. Se aplica el
muestreo por conglomerados a aquellas zonas geográficas donde la población es bastante amplia,
las etapas son:
1ro. Toda la población se divide en varias zonas geográficas, se realiza una lista de estas y son
elegidas algunas al azar.
2do. De cada zona elegida al azar se saca una muestra aleatoria que luego será estudiado.

MUESTRA NO PROBABILISTICA

Las muestras no probabilísticas, también llamadas muestras dirigidas, suponen un procedimiento de


selección informal y un poco arbitraria. Aún así se utilizan en muchas investigaciones y a partir de ellas
se hacen inferencias sobre la población. Es como si juzgásemos el sabor de un cargamento de limones,
solamente probando alguno, como si para “muestra bastase un botón”. La muestra dirigida selecciona
sujetos “típicos” con la vaga esperanza de que sean casos representativos de una población determinada.

La verdad es que las muestras dirigidas tienen muchas desventajas. La primera es que, al no ser
probabilísticas, no podemos calcular con precisión el error estándar, es decir, no podemos calcular con
qué nivel de confianza hacemos una estimación. Esto es un grave inconveniente si consideramos que la
estadística inferencial se basa en teoría de probabilidades, por lo que pruebas estadísticas en muestras no
probabilísticas tienen un valor limitado y relativo a la muestra en sí, más no a la población. Es decir, los
datos no pueden generalizarse a una población que no se consideró ni en sus parámetros, ni en sus
elementos para obtener la muestra.

La ventaja de una muestra no probabilística es su utilidad para determinado diseño de estudio que
requiera no tanto una “representatividad de elementos de una población, sino una cuidadosa y controlada
elección de sujetos con ciertas características especificadas previamente en el planteamiento del
problema”. Hay varias clases de muestras dirigidas, como por ejemplo la muestra de sujetos voluntarios,
la muestra de expertos y la muestra por cuotas.

Una muestra es llamada muestra de juicio cuando sus elementos son seleccionados mediante juicio
personal. La persona que selecciona los elementos de la muestra, usualmente es un experto en la medida
dada. Una muestra de juicio es llamada una muestra no probabilística, puesto que este método está basado
en los puntos de vista subjetivos de una persona y la teoría de la probabilidad no puede ser empleada
para medir el error de muestreo, Las principales ventajas de una muestra de juicio son la facilidad de
obtenerla y que el costo usualmente es bajo.
Facultad Integral del Norte – U.A.G.R.M.
Materia: MAT-260, Estadística II
Docente: Ing. René Alfredo Ovando Patiño 4

TEORIA DE LA ESTIMACION

En estadística se llama estimación al conjunto de técnicas que permiten dar un valor aproximado de un
parámetro de una población a partir de los datos proporcionados por una muestra.

En su versión más simple, una estimación de la media de una determinada característica de una población
de tamaño N sería la media de esa misma característica para una muestra de tamaño n.
Un estimador de un parámetro poblacional es una función de los datos muestrales. En pocas palabras, es
una fórmula que depende de los valores obtenidos de una muestra, para realizar estimaciones.
Por ejemplo, un estimador de la media poblacional, μ, sería la media muestral, , según la siguiente
fórmula:

Donde (x1, x2, ..., xn) sería el conjunto de de datos de la muestra.

En el ejemplo se habla de una estimación puntual. Sin embargo, el estimador es una variable aleatoria
que asigna a cada valor de la función su probabilidad de aparición, esto es, la probabilidad de la muestra
de la que se extrae.

Estimación puntual
Consiste en la estimación del valor del parámetro mediante un sólo valor, obtenido de una fórmula
determinada. Por ejemplo, si se pretende estimar la talla media de un determinado grupo de individuos,
puede extraerse una muestra y ofrecer como estimación puntual la talla media de los individuos.

Estimación por intervalos


Consiste en la obtención de un intervalo dentro del cual estará el valor del parámetro estimado con una
cierta probabilidad. En la estimación por intervalos se usan los siguientes conceptos:

INTERVALOS DE CONFIANZA

La estimación por intervalos se refiere a un rango dentro del cual encontramos el parámetro, con un nivel
de significación , por lo tanto el nivel de confiabilidad que tendrá la estimación del parámetro será ( 1
-)

 IC para  cuando se muestrea una distribución normal con varianza conocida:



Intervalo de Confianza  X  z *
n
Facultad Integral del Norte – U.A.G.R.M.
Materia: MAT-260, Estadística II
Docente: Ing. René Alfredo Ovando Patiño 5

Tamaño de muestra: n es necesario para efectuar la estimación de , con  conocido, por lo tanto n se
puede estimar de la siguiente forma:
2
 z * 
n 
  
en donde  representa las unidades alrededor del parámetro.

 IC para  cuando se muestrea una distribución normal con varianza desconocida:

Es parecida a la anterior pero ahora se desconoce 2, entonces la varianza se estima por S 2.
Entonces el IC queda:

S
Intervalo de confianza  X  t *
n

 Diferencia de medias de 2 poblaciones normales e independientes:

Sean las poblaciones normales e independientes X e Y, con sus respectivas medias y varianzas
conocidas, entonces el intervalo de confianza es:

 x2  y2
Intevlo de confianza  ( X  Y )  z 
nx ny

 IC para p, parámetro de proporción en una muestra de distribución binomial.

pˆ (1  pˆ )
Intervalo de confianza  pˆ  z
n

Tamaño de muestra para este caso:

z 2 * p(1  p)
n
2

También podría gustarte