MUESTREO (Autoguardado)

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 48

TEORÍA DEL MUESTREO

TIPOS DE MUESTREO

PROBABILISTICO NO PROBABILISTICO
(Aleatorio) (No aleatorio)
Muestreo al azar simple A juicio del investigador
Muestreo Sistemático Por voluntad propia
Muestreo estratificado  

Muestreo por conglomerados


Muestreo por áreas geográficas
 
MUESTREO

3. METODOS DE SELECCIÓN DE UNA MUESTRA.- Para seleccionar los


elementos de una muestra hay la técnica probabilística o aleatoria y la técnica no
probabilística o no aleatoria.
TÉCNICAS PROBABILÍSTICAS.- entre ellas se tiene.
a. El muestreo al azar simple
b. El muestreo por números aleatorios
c. El muestreo sistemático
d. El muestreo estratificado
e. El muestreo por conglomerados

TECNICAS NO PROBABILISTICAS
a. El muestreo dirigido
b. El muestreo por voluntad
c. El muestreo de juicio
TÉCNICAS PROBABILISTICAS.
Muestreo al azar simple.-
Se realiza de forma similar a cuando procedemos a un sorteo, a cada persona o elemento de la población
le asignamos un número entero desde 1 hasta N, que es el número total de elementos de la población,
Se preparan tickets numerados de 1 hasta N y le entregamos a cada elemento de la población, a
continuación le pedimos que cada persona coloque su apellido en estos tickets y después de doblarlos en
varias partes lo depositen en una ánfora.
Con todos los tickets en el ánfora después de mover esta ánfora varias veces y como si fuera un sorteo se
comienza a extraer uno por uno los tickets y se va dando lectura de los apellidos que figuran en los
tickets
Estos serán los seleccionados y la extracción se hará hasta sacar el ticket número n que sería el tamaño de
la muestra que se desea obtener. Mediante este procedimiento se estaría garantizando que los
seleccionados o nominados son al azar o que la extracción ha sido aleatoria o imparcial que es lo que se
requiere de una muestra no sesgada, ni dirigida a los intereses del seleccionador.
b. El muestreo por números aleatorios.- Muchos de los libros de Estadística tiene
entre sus anexos una tabla de Números Aleatorios que se han formado en base a un
software electrónico, generalmente se presentan en una o dos caras y en cada cara hay
entre 8 a 10 columnas de números de 5 cifras:
31470 26931 75009 60214 49877 31000 51280 72950 31609 41267
51321 16962 32033 85204 67125 34055 41584 27111 24633 61278
11204 00125 37715 43631 15009 63314 40062 30000 25204 33256

Si tenemos 100 personas y debo extraer una muestra de 15. Se toma cualquier fila
y columna, ejemplo primera fila tercera columna, ahí está el número 75009, de
este número tomo sus dos primeros dígitos que es 75 éste es el primer elemento
de mi muestra de los 100 y de esta misma manera procedo con los números que
siguen del 60214, tomamos los dos primeros dígitos 60, luego del 49877 separo
el 49 del 31000 separo el 31 y así con los siguientes.

Si seguimos vamos a encontrar el 31609 cuyos dos primeros dígitos es 31 pero


como ya salió 31 se descarta porque solo puede salir una vez en la muestra de 15.
MUESTREO ALEATORIO SIMPLE
c. El muestreo sistemático.- Esta técnica consiste en dividir el total de datos en
partes iguales de tamaño k, donde k = N/n . Si mi población es de 100
personas N =100 y si deseo una muestra de tamaño n =15, el valor de k es k
=100/15 = 6,667, se toma k = 7. Los seleccionados serán: escogemos como punto
de partida un número seleccionado al azar entre 1 y 7, puede ser 4 entonces mi
muestra estará formada por: 4, 4+7, 11+7, 18 + 7, 25 + 7, ……..,

4 11 18 25 32 39 46 53 + 7……..
MUESTREO SISTEMATICO
d. El muestreo estratificado.- muchas veces tenemos que analizar si en nuestra
población existen o no ESTRATOS. Estos vienen a ser grupo de elementos de la
población que tienen características similares; como por ejemplos en una
población hay varones, todos ellos tienen características similares, por ello este
grupo de varones es un estrato. Las mujeres también tiene características similares,
por ello las mujeres forman otro estrato. Entonces de acuerdo al género hemos
formado dos estratos.

De acuerdo a la edad, podemos formar varios estratos: los niños, los adolescentes,
los jóvenes , los adultos y los ancianos.

Por la especialidad de estudios universitarios, un estrato es Agronomía, otro


Educación, otro Economía y así podemos obtener otros estratos de especialidad.
e. El muestreo por conglomerados.- Si deseo realizar un estudio sobre alguna
enfermedad, a los pacientes portadores, además de ubicarlos en su domicilio, también
los puedo ubicar en el hospital, por ello un hospital se dice que es un conglomerado de
pacientes. El hospital también es un conglomerado de Médicos, de enfermeras etc.

Una universidad es un conglomerado de alumnos, un conglomerado de profesores, un


conglomerado de libros de la biblioteca, etc
TÉCNICAS NO PROBABILISTICAS

a. El muestreo dirigido.- En estas técnicas ya no se aplica la selección al azar, aquí


la muestra está orientada a los intereses particulares del investigador, por ello los
elementos de la muestra se seleccionan va dirigida a ese grupo que tengan las
condiciones de interés.

b. El muestreo por voluntad.- Hay ocasiones en donde es imposible conseguir una


muestra al azar, pero se tiene la posibilidad de tener grupo de personas voluntarias
que desean colaborar con la investigación, por lo que se tendrá que recurrir a su
apoyo desinteresado

c. El muestreo de juicio.- En ocasiones la experiencia del investigador le permite


tener un conocimiento de las personas que reúnen los requisitos para ser elemento de
ESTIMACION DE PARAMETROS
 
Los parámetros son valores que generalmente no se pueden obtener porque corresponden a la población y los trabajos de
investigación sólo se hacen con las muestras, o sea con una parte de la población. Entonces, en la práctica se calculan los
valores de las muestras llamados estadísticos y con estos valores se infieren los valores de los parámetros por medio de
fórmulas para intervalos de confianza.

Valores MUESTRA POBLACION


(Estadísticos) (Parámetros)
Número de datos n N
Media aritmética x 
Desviación S 
estándar
Varianza S2 2
Casos deseados x X
Proporción
éxito
de p = x/n  X/N

Proporción
fracaso 2
de q=1-p
1  
TAMAÑO DE LA MUESTRA

En todo trabajo de investigación, uno de los primeros problemas del investigador es


determinar el tamaño de su muestra.
Conocer con cuántos alumnos debe realizar su investigación, o a cuántos profesores
debe entrevistar, o a cuántos padres de familia debe entrevistar.
Para calcular el tamaño de la muestra la estadística proporciona fórmula
TAMAÑO DE LA MUESTRA

a)Para estudios de promedios

z2s2
n
E2

z2s2N
n
E 2 ( N  1)  z 2 s 2

b) Para estudios de proporciones

z 2 pq
n
E2

z 2 pqN
n
E 2 ( N  1)  z 2 pq

z2N
n
4 E 2 ( N  1)  z 2
PRACTICA EXCEL SPSS
1.- Se desea realizar un estudio sobre el uso de anticonceptivos en mujeres fértiles del distrito de Pueblo Nuevo, que cuenta
con 1200 mujeres de 15 a 49 años de edad. ¿Cuántas de ellas deben seleccionarse aleatoriamente? Si mediante un sondeo
de opinión a 20 de ellas sobre si usan o no, respondieron de la siguiente manera: Si No No Si No No No No
No Si Si No Si Si No Si No No Si No. Considere un error muestral del 4% y trabaje con un nivel de confianza
del 99%
SOLUCION

  = 1200 mujeres
N  n = = = 545,24
n = 20 mujeres
x = 8 Si
p = = 0,40
q = 0,60
E = 4 % = 0,04
z = 2,58
Respuesta.- Con un 99% de confianza y un error muestral del 4% se deben seleccionar 546
mujeres de 15 a 49 años de edad del distrito de Pueblo Nuevo, para realizar el estudio sobre
uso de anticonceptivos
2. Debiéndose realizar un estudio en madres que residen en el Asentamiento Humano LA PALMA
GRANDE sobre el grado de conocimiento de las enfermedades diarreica aguda (EDA), se recurre a un
estudio similar realizado en el AAHH SANTA ROSA que tiene las mismas características socioeconómicas,
donde el 30% de las medres tenían un Buen Conocimiento de las EDA. A un nivel de confianza del 99%
¿De qué tamaño debe ser la muestra si se desea que la estimación de la verdadera proporción se aleje a lo
más en un 4%?. ¿De qué tamaño debe ser la muestra si la población total de madres en este AAHH LA
PALMA GRANDE es de 700 ?
No se conoce N
p = 30% Buen conocimiento 2,58 2 0,30𝑥 0,70 1,397844
q = 70% n= = = 873,65 = 874
0,04 2 0,0016
z = 2,58
E = 4 % = 0,04
Si se conoce N = 700
N = 700
2,58 2 0,30𝑥 0,70 𝑥 700 978,4908
n= = =
0,04 2 ሺ700−1 ሻ+ 2,58 2 𝑥 0,30 𝑥 0,70 2,516244

n = 388,8696 = 389

Respuesta.- Con un 99% de confianza y un error muestral del 4% la muestra debe ser de 874 madres, pero
cuando se conoce la población total de 700 madres, el tamaño de la muestra debe ser 389 para realizar el
estudio sobre el grado de conocimiento de las enfermedades diarreica aguda EDA
3. El director de la sección de control de la rabia del departamento de salud pública, desea extraer una
muestra de los registros de mordidas de perro reportadas durante el transcurso del año pasado para estimar la
media de la edad de las personas mordidas. Requiere un intervalo de confianza del 95%, decide utilizar un
valor del 2,5 para el error muestral de la media y a partir de estudios anteriores, estima que la desviación
estándar de la población está alrededor de los 15 años ¿Qué tan grande debe ser el tamaño de la muestra?

𝝈 = 15 años 1,962 𝑥 15 2 864,36


z = 1,96 n= = = 138,30 = 139
2,5 2 6,25
E = 2,5

Respuesta.- Con un 95% de confianza y con un error muestral de la media de 2,5 años la muestra debe
ser de 139 registros de mordida de perro
4. Se planea realizar una encuesta para determinar qué proporción de los estudiantes de secundaria de
Lima metropolitana han fumado regularmente marihuana. Si no se cuenta con una estimación de la
proporción de éxito (p) de estudios anteriores, no se puede extraer una muestra piloto, se desea una
confianza del 95% y se decide utilizar un error muestral del 4% y con ello determinar el tamaño
adecuado de la muestra.
SOLUCION

z = 1,96 1,962 3,8416


E = 4 % = 0,04 n= = = 600,25
4 𝑥 0,04 2 0,0064

Respuesta.- Con un 95% de confianza y un error muestral del 4% se deben seleccionar 601 alumnos
de secundaria de Lima metropolitana para realizar la encuesta de los que han fumado regularmente
marihuana
HIPOTESIS
Es toda afirmación que para que sea aceptada como tal requiere de una previa demostración
 
“Los porcentaje de niños parasitados y que residen en zonas marginales es mayor al porcentaje de niños
parasitados que viven en las zonas urbanas”
 
“Las mujeres tienen en promedio menos hemoglobina que los varones”
 
“Los adultos mayores de 60 años que prefieren el consumo de carne de pollo, tienen en promedio más
colesterol que los adultos que prefieren el consumo de carne de pescado”
 
“La menarquia se presenta anta de los 11 años en niñas de la selva peruana”
 
“La prostatitis en los varones sedentarios se está presentando antes de los 40 años de edad”
 
“Un alto porcentaje de niños se está alimentando con frituras por ello se encuentran en sobrepeso”
 
“Más del 30% de los vendedores ambulantes de comida nocturna que se encuentran dentro del cercado
no cuentan con carnet de salud”
 
Estadísticamente se tienen dos tipos de hipótesis, la hipótesis nula y la hipótesis alterna
HIPOTESIS NULA ( Ho ).- Es aquella afirmación que se trata de invalidar o rechazar
HIPOTESIS ALTERNA ( H1 ).- Es toda expresión contraria a la hipótesis nula (Esta es la hipótesis
del investigador)

TIPOS DE ERRORES

Error de tipo I. Es rechazar una hipótesis cuando en realidad es verdadera

Error de tipo II. Es aceptar una hipótesis cuando esta es falsa

NIVEL DE SIGNIFICACION.
La probabilidad de cometer un error de tipo I se llama nivel de significación y se representa por 

Los valores que frecuentemente se emplean para 


0,05 (5%); p*
0,01 (1%); p**

0,001 (0,1%) p***


REGIÓN CRÍTICA Y REGIÓN DE ACEPTACIÓN
Región crítica o región de rechazo, es la región que contiene los valores para los cuales se rechaza la
hipótesis nula
Región de aceptación, es la región que contiene los valores para los cuales no se rechaza la hipótesis nula

a) Prueba unilateral a la izquierda b) Prueba unilateral a la derecha

Acepto H 1 Acepto H 0 Acepto H 0 Acepto H 1

0 0

c) Prueba bilateral

Acepto H1 Acepto H 0 Acepto H 1


FORMULARIO

PRUEBA DE HIPÓTESIS PARA MEDIAS PRUEBA DE HIPÓTESIS PARA PROPORCIONES


a).Para la media b) Para dos medias c) Para una proporción d) Para dos proporciones
de éxito
aritmética aritméticas de éxito

x x1  x 2 p  p1  p 2
t t t t
s 1 1 p(1  p ) pq pq
s.  
n1 n 2 n n1 n2
n
g.l. = n - 1 x1  x 2
(n1  1) s12  (n 2  1) s 22 p
s donde n1  n 2
n1  n 2  2 q  1 p

g.l. = n1 + n2 – 2
  NIVEL DE SIGNIFICACION
g.l. 0,05 0,01

1 cola 2 colas 1 cola 2 colas

8 1,86 2,31 2,90 3,36


9 1,83 2,26 2,82 3,25
10 1,81 2,23 2,76 3,17
11 1,80 2,20 2,72 3,11
12 1,78 2,18 2,68 3,05
13 1,77 2,16 2,65 3,01
14 1,76 2,14 2,62 2,98
15 1,75 2,13 2,60 2,95
16 1,75 2,12 2,58 2,92
17 1,74 2,11 2,57 2,90
18 1,73 2,10 2,55 2,88
19 1,73 2,09 2,54 2,86
20 1,72 2,09 2,53 2,85
21 1,72 2,08 2,52 2,83
22 1,72 2,07 2,51 2,82
23 1,71 2,07 2,50 2,81
24 1,71 2,06 2,49 2,80
25 1,71 2,06 2,48 2,79
26 1,71 2,06 2,48 2,78
27 1,70 2,05 2,47 2,77
28 1,70 2,05 2,47 2,76
29 1,70 2,04 2,46 2,76
30 1,70 2,02 2,46 2,75
40 1,68 2.02 2,42 2.70
50 1,67 2.01 2,40 2.68
60 1,67 2.00 2,39 2.66
70 1,67 1.99 2,38 2.65
80 1,66 1.99 2,37 2.64
90 1,66 1.99 2,37 2.63
100 1,66 1.98 2,36 2.63
120 1,65 1.98 2,36 2.62
200 1,65 1.97 2,34 2.60
oo 1,64 1.96 2,33 2.58
Acepto Ho Acepto H1
Si n = 41  
g.l. = 41 – 1 = 40
 
 = 0.05
0 1.68 9.55
t = 1.68

Si n = 30 Acepto H 1 Acepto Ho
g.l. = 30 – 1 = 29  
 = 0.05  
t = 1.70
-1.70 0 1.45

AceptoH 1 Acepto Ho  AceptoH 1


Si n = 71
g.l. = 71 – 1 = 70  
 = 0.05
t = 1.99 -2.15 -1.99 0 1.99
PROBLEMAS DE UNA MEDIA ARITMÉTICA

1. Un bachiller en enfermería cree que los pacientes que son intervenidos quirúrgicamente de apendicitis
deben permanecer en la sala de recuperación por más de 150 minutos, porque aquellos que fueron retirados
de la sala en el tiempo ordenado varios tuvieron serios malestares que requirieron volver a recuperación.
Para probar su hipótesis el cirujano seleccionó 50 historias clínicas de pacientes que retornaron a la sala de
recuperación y sus tiempos (en minutos) que habían permanecido en recuperación luego de su intervención
quirúrgica fueron:
140 150 145 160 145 155 140 150 150 155 140 160 150 145 155 155 160
140 150 145 145 150 145 135 150 150 145 140 155 140 145 145 155 150
140 150 160 145 145 150 140 140 155 150 160 155 150 140 160 150
Con la ayuda de esta muestra seleccionada al azar y con un 95% de confianza se podrá concluir que el
bachiller en enfermería tiene razón?.

 HIPOTESIS
H0 : 150 Los pacientes intervenidos de apendicitis deben permanecer hasta 150 minutos en la sala de
recuperación
H1 : < 150 Los pacientes intervenidos de apendicitis No deben permanecer más de 150 minutos en la sala de
recuperación (Opinión del bachiller)
H0

n = 50 historias
ഥ= 148,6 minutos Rechazar H 0 Aceptar H 0
𝒙
s = 6,64 min
z = 1,64 (Una cola al 95%)

-1,49 - 1,64 0

NIVEL DE SIGNIFICACION.- 𝛼 = 0,05


ESTADISTICO DE PRUEBA Y CALCULOS
x   148,6  150  1,4
z = = z = – 1,49
s 6,64 0,939037
n 50
DISCUSION.- Como el estadístico calculado Zc = - 1,49 es menor que el estándar Zt =
1,64 cae en la zona de aceptación de H0
PROBLEMAS DE UNA MEDIA ARITMÉTICA

1.- Un bachiller de Contabilidad está realizando un estudio sobre las clases virtuales por los alumnos de
la universidad en el presente Ciclo Académico y entre una de sus variables de estudio está el GASTO
MENSUAL (en soles) por uso de su celular para asistir a las clases virtuales, él cree que el Gasto
promedio mensual está por encima de los 30 soles y que los alumnos consideran que está contra la
economía familiar. Para probar su hipótesis el bachiller seleccionó a 80 alumnos universitarios y obtuvo
los siguientes montos en los gastos:

31 29 43 28 23 35 32 24 21 42 48 33 26 34 41 38 27
36 32 26 28 23 32 48 43 32 26 34 36 36 32 27 32 36
32 34 33 27 23 27 37 27 34 36 27 32 34 27 36 34 36
32 36 36 32 23 41 34 36 36 27 36 31 36 36 41 36 38
36 32 41 34 37 32 36 27 36 32 41 31          

Con un nivel de significación del 5% será cierto lo que sostiene el bachiller de Contabilidad?

Ho:   30 El gasto promedio por uso de celular para asistir a las clases virtuales no está por encima de los
30 soles

H1:   30 El gasto promedio por uso de celular para asistir a las clases virtuales está por encima de los
30 soles
PROBLEMAS DE DOS MEDIAS ARITMÉTICAS
1.- La Dirección de Bienestar Universitario cree que los alumnos que trabajan tiene un mayor gasto en sus
mensualidades por el uso del celular. Para probar su hipótesis seleccionó dos muestras aleatorias una de 20
alumnos que trabajan y otra de 60 alumnos que no trabajan y después de obtener el gasto mensual por uso
del celular de cada uno de los alumnos lo resume así:
TRABAJAN
34 41 43 36 48 36 36 42 36 43 26 36 34 41 41 36 34
41 36 29                            

NO TRABAJAN
23 27 28 34 27 23 32 28 27 36 32 36 32 32 26 27 34
24 26 36 32 32 23 27 37 38 32 23 32 27 36 27 36 36
27 36 41 34 37 31 36 36 33 34 32 31 34 33 32 32 36
31 38 48 32 32 27 21 36 35                

Con un nivel de significación del 5% se aceptará la afirmación de la Dirección de Bienestar Universitario


PROBLEMAS DE UNA PROPORCIÓN DE ÉXITO

1.- La Dirección de Bienestar Universitario sostiene que el porcentaje de alumnos universitarios que
trabajan es menor al 20% y para justificar su afirmación seleccionó una muestra aleatoria de 80 alumnos y
los resultados fueron (1 = Si trabaja, 2 = No trabaja)
1 2 2 2 2 2 2 2 1 2 1 2 2 1 1 2 1
2 1 2 2 2 2 2 1 2 2 2 1 2 2 1 2 2
2 2 2 2 2 1 2 2 2 1 2 2 2 1 2 2 2
1 2 1 2 2 2 2 2 2 2 2 1 2 2 2 2 1
2 2 2 2 1 1 2 2 2 1 2 2 2 2 2 2 2
HIPÓTESIS
Ho:  0.20 No es cierto que menos del 20% de los alumnos trabajan

H1:   0.20 Menos del 20% de los alumnos trabajan


PROBLEMAS DE DOS PROPORCIONES DE ÉXITO

1.- Un bachiller en enfermería a observado que las mujeres usan más el celular que los varones para asistir a
sus clases virtuales y para probar su hipótesis seleccionó dos muestras aleatorias una de 32 mujeres y otra
de 48 varones y los resultados fueron (1 = Laptop, 2 = Celular, 3 = Tablet, 4 = Pc)

Mujeres
1 2 4 3 2 4 4 1 2 3 2 4 2 2 4 2 1
2 4 3 2 4 4 2 4 4 2 3 2 1 2 1    
Varones
1 3 4 2 1 2 2 4 3 1 2 2 4 1 2 2 1
1 1 4 1 2 2 1 2 4 1 3 2 4 1 2 4 2
1 1 2 2 4 1   3 2 2 4 3 1 1    
Con un nivel de significación del 5% será cierto lo que afirma el bachiller en Ingeniería

También podría gustarte