Tamaño Óptimo de La Muestra

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 13

Ensayo de Temas Momento II

Estadística Descriptiva

Michel Leonardo Bolívar Pineda


Juan Felipe Riaño Lozano

Universidad Cooperativa
Campus Bogotá
21/05/2024
Tamaño óptimo de la muestra
Se refiere al número de observaciones o participantes que se deben incluir en
un estudio para obtener resultados confiables y representativos de la población
objetivo. Determinar el tamaño óptimo de la muestra implica considerar varios
factores, como el tamaño del efecto que se espera detectar, el nivel de
confianza deseado, el margen de error aceptable y la variabilidad inherente de
los datos.

Muestreo aleatorio Simple


El muestreo aleatorio simple es una técnica la cual pertenece al muestreo
estadístico en la que cada miembro de una población tiene la misma
probabilidad de ser seleccionado. Esta es una de las formas más básicas y
utilizadas del muestreo probabilístico debido a su simplicidad y facilidad a la
hora de su utilización el muestreo aleatorio simple es una técnica fundamental
en la estadística que proporciona una base sólida para la recolección de datos
representativos y permite realizar inferencias válidas sobre la población a partir
de la muestra seleccionada

Ejemplo:
una empresa quiere realizar una encuesta para medir la satisfacción de sus
clientes. Actualmente, la empresa tiene 10,000 clientes y desea obtener
resultados que sean representativos con un 95% de confianza y un margen de
error del 5%

( 1−p )∗p∗z 2
n=
E2
Con esta fórmula se llega a la realización del ejercicio el cual Z es el 95%
El margen de error representado como E es de 5%
p sino se llega a tener este valor se utiliza el 0.5 para maximizar la variabilidad
lo cual muestra un tamaño de la muestra más conservador
n es la cantidad total de clientes la cual es 10.000

No∗n
n=
n−1+ No

Y esta formula es para determinar con rango de población finita y la de arriba


es la población infinita de la muestra.
Prueba de hipótesis para una población:
Una prueba de hipótesis para la media se utiliza para determinar si la media de
una muestra es significativamente diferente de una media poblacional
específica. Esto se puede hacer usando una distribución normal (Z) o una
distribución t de Estudiante, dependiendo del tamaño de la muestra y si se
conoce la desviación estándar de la población.

Ejemplo:
una empresa afirma que el tiempo medio de atención al cliente es de 5
minutos. Un auditor quiere verificar esta afirmación tomando una muestra de 36
llamadas y encuentra que el tiempo medio es de 5.5 minutos con una
desviación estándar de 1.2 minutos. Usaremos un nivel de significancia del 5%.
Primeramente, se tendrá que plantear la hipótesis.
(H₀): 𝜇=5 Aquí se tiene que el tiempo medio es de 5 minutos
(Esta es la hipótesis nula)
(H₁): 𝜇≠5 (este es que el tiempo medio NO es de 5 minutos
(Esta de arriba es la hipótesis alternativa)

después se seleccionará el nivel de significancia


(α): 0.05.

Después de esto se deberá calcular el estadístico de prueba el cual se utilizará


la Z para muestras grandes
x −μ
Z=
σ
√n
La cuales la
x : es la media muestral (5.5)
μ: Es la media poblacional bajo la hipótesis (5)
σ es la desviación estándar muestral (1.2).
n es el tamaño de la muestra (36)

Como Ultimo se evaluará estos resultados tomando que los valores críticos son
Z ± 1.96

En este ejemplo Z= 2.5 entonces |2.5| > 1.96

Prueba hipótesis para la proporción


Una prueba de hipótesis para la proporción se utiliza para determinar si la
proporción de una muestra es significativamente diferente de una proporción
poblacional específica
Ejemplo
Una prueba de hipótesis para la proporción se utiliza para determinar si la
proporción de una muestra es significativamente diferente de una proporción
poblacional específica
Primeramente, se tendrá que plantear la hipótesis.
(H₀) : p = 0.60 (60% de los clientes están satisfechos)
(Esta es la hipótesis nula)
(H₁) p :≠0.60 (la proporción de los clientes satisfechos NO es 60%)
(Esta de arriba es la hipótesis alternativa)

después se seleccionará el nivel de significancia


(α): 0.05.

Para ésta se usa la formula del estadístico Z para proporciones:


^p−Po
Z=
Po(1−Po)
n
^p : Es la proporción muestral ((55/100 = 0.55)
Po: Es la proporción poblacional bajo la hipótesis nula (0.60)
n: Es el tamaño de la muestra (100)

Como Ultimo se evaluará estos resultados tomando que los valores críticos son
Z ± 1.96
En este ejemplo Z= -1,02 entonces |-1.02| < 1.96

Prueba de Hipótesis para la diferencia de medias


Una prueba de hipótesis para la diferencia de medias se utiliza para comparar
las medias de dos poblaciones independientes y determinar si hay una
diferencia significativa entre ellas. Esta prueba se puede realizar utilizando la
distribución t de Estudiantes si las muestras son pequeñas y/o las desviaciones
estándar poblacionales son desconocidas, o la distribución Z para muestras
grandes y desviaciones estándar conocidas.
Ejemplos
queremos comparar los salarios medios de dos departamentos (A y B) en una
empresa. Tomamos una muestra aleatoria de 30 empleados de cada
departamento. La media salarial en el departamento A es $50,000 con una
desviación estándar de $5,000, y en el departamento B es $48,000 con una
desviación estándar de $4,500. Usamos un nivel de significancia del 5%.

Primeramente, se harán las dos hipótesis:


(Ho): μa = μb (no hay diferencia en las medias salariales).
(H₁): μA= μB (hay una diferencia en las medias salariales).

después se seleccionará el nivel de significancia


(α): 0.0

Luego se utilizará la formula del estadístico t para muestras independientes:


Xa−X b
t=


2 2

As Bs
+
An B n
En los cuales son:
X a : Es la media muestral del departamento A
X b : Es la media muestral del departamento B
2

A s : son las desviaciones estándar muestrales de los departamentos A y B,


respectivamente.
2

Bs : Son los tamaños de las muestras de los departamentos A y B,


respectivamente.

En este caso se toma la tabla de distribución t luego para encontrar el valor


critico que el correspondiente a 0.05 es de ±2.001
Y como resultado al remplazar en la formula fue de |1.63|
Por ende
|1,63| < 2.001

Prueba de Hipótesis para la diferencia de proporciones


Una prueba de hipótesis para la diferencia de proporciones se utiliza para
comparar las proporciones de dos poblaciones independientes y determinar si
hay una diferencia significativa entre ellas.
Ejemplo
queremos comparar la proporción de clientes satisfechos entre dos tiendas
(Tienda 1 y Tienda 2). En una muestra de 150 clientes de la Tienda 1, 90 están
satisfechos, y en una muestra de 200 clientes de la Tienda 2, 130 están
satisfechos. Usamos un nivel de significancia del 5%.
Primeramente, se plantearán las hipótesis
(H₀): p1=p2 (no hay diferencia en las proporciones de clientes satisfechos).
Esta de arriba es la hipótesis nula
(H₁): 𝑝1≠𝑝2 (hay una diferencia en las proporciones de clientes satisfechos).
Esta de arriba es la hipótesis alternativa
Después se seleccionará el nivel de la significancia
Nivel de significancia (α): 0.05.
Luego se usará la formula del estadístico Z para las diferencias proporcionales.
^p 1−^p 2
Z=

√ p(1−p)(
1 1
n
1 2
+ n)

Donde en la formula los valores son


^p 1 : Es la proporción muestral de la Tienda 1 (90/150 = 0.60)
^p 2 : Es la proporción muestral de la Tienda 2 (130/200 = 0.65)
p es la proporción combinada la cual tiene como formula la siguiente

( p= xn 1+1+ nx 22 = 150+200
90+130 220
=
350
≈ 0.6286 )

n1 y n2 son los tamaños de las muestras en las tiendas 1 y 2 respectivamente

En estos valores críticos de Z vuelve a ser 1.96

Entonces se obtuvo al remplazar la formula que | - 0.96| < 1.96

Intervalos de confianza para la media


Un intervalo de confianza para la media es un rango de valores que, con un
cierto nivel de confianza, contiene la media verdadera de la población. El nivel
de confianza, usualmente expresado como un porcentaje (por ejemplo, 95%),
indica la probabilidad de que el intervalo contenga la media poblacional.
Ejemplo:
tomamos una muestra de 25 estudiantes y encontramos que la media de sus
puntuaciones en un examen es 78 con una desviación estándar muestral de 10
puntos. Queremos calcular un intervalo de confianza del 95% para la media
verdadera de las puntuaciones.

Media muestral (𝑥ˉ): 78


Desviación estándar muestral (𝑠): 10
Tamaño de la muestra (𝑛): 25
Nivel de confianza: 95%
Cuando se tenga la desviación estándar la formula es
σ
IC=x ± Z α ( )
2
df √n

Y para cuando la población tenga la desviación estándar sea desconocida será


de
s
IC=x ±t α ( )
2
df √n

x : Es la media muestral
Z α : Es valor critico de la distribución normal estándar
2

t α : Es valor critico de la distribución con df grados de libertar (n-1)


2

σ es la desviación estándar poblacional.


s es la desviación estándar muestral.
n es el tamaño de la muestra.

Ahora sabiendo esto, remplazando los valores en la fórmula que aplica que es
la que tiene desviación estándar
Lo cual nos da como resultado
IC= [73,872, 82.128]

Intervalo de confianza para la proporción


Un intervalo de confianza para la proporción es un rango de valores que, con
un cierto nivel de confianza, contiene la proporción verdadera de la población.

Para esta solo tenemos una única fórmula de proporción utilización la


distribución Z

IC= ^p ± Z α
2 √ ^p (1− ^p )
n
En la cual tenemos que

^p : Es la proporción muestral

Z α : Es el valor critico de la distribución normal estándar


2

N Es el tamaño de la muestra

Ejemplo
una muestra de 200 votantes, 120 dijeron que votarían por el candidato A.
Queremos calcular un intervalo de confianza del 95% para la proporción
verdadera de votantes que apoyan al candidato A
Proporción muestral (𝑝^): 120/200 =0.60
Tamaño de la muestra (n) = 200
Nivel de confianza 95%
Y al remplazar esto se tiene que
IC [ 0,5322,0,6678]

Prueba de hipótesis para la diferencia de medias


Una prueba de hipótesis para la diferencia de medias se utiliza para comparar
las medias de dos poblaciones independientes y determinar si hay una
diferencia significativa entre ellas. Esta prueba puede usar la distribución t de
Estudiante si las muestras son pequeñas y/o las desviaciones estándar
poblacionales son desconocidas, o la distribución Z para muestras grandes y
desviaciones estándar conocidas.

Ejemplo
queremos comparar las puntuaciones medias de dos grupos de estudiantes
que usaron dos métodos de estudio diferentes. Tomamos una muestra de 30
estudiantes de cada grupo. El grupo A tiene una media de 78 con una
desviación estándar de 10, y el grupo B tiene una media de 74 con una
desviación estándar de 8. Usaremos un nivel de significancia del 5%.
Se plantearán las hipótesis

(H₀): 𝜇𝐴=𝜇𝐵 (no hay diferencia en las medias).


Hipótesis nula
(H₁): 𝜇𝐴≠𝜇𝐵 (hay una diferencia en las medias).

Nivel de significancia (α): 0.05.

En este se va a utilizar la formula del estadístico t para las muestras


independientes
Xa−X b
t=


2 2

As Bs
+
An B n

X a : Es la media muestral del departamento A


X b : Es la media muestral del departamento B
2 2

A s y B s : son las desviaciones estándar muestrales de los grupos A y B


n n
a y b : Son los tamaños de las muestras de los departamentos A y B

Al remplazar los valores tenemos que el resultado será de 1,71

En este caso se toma la tabla de distribución t luego para encontrar el valor


critico que el correspondiente a 0.05 es de ±2.001
Y como resultado al remplazar en la formula fue de |1.63|
Por ende
|1,71| < 2.001

Prueba de Hipótesis para la diferencia de proporciones


Una prueba de hipótesis para la diferencia de proporciones se utiliza para
comparar las proporciones de dos poblaciones independientes y determinar si
hay una diferencia significativa entre ellas.
Ejemplo
queremos comparar la proporción de éxito de dos tratamientos médicos. En
una muestra de 100 pacientes que recibieron el Tratamiento A, 60 tuvieron
éxito, y en una muestra de 120 pacientes que recibieron el Tratamiento B, 72
tuvieron éxito. Usaremos un nivel de significancia del 5%.

Planteamos nuevamente las hipótesis


(H₀): 𝑝𝐴=𝑝𝐵 (no hay diferencia en las proporciones de éxito).
(Esta es la hipótesis nula)
(H₁): 𝑝𝐴≠𝑝𝐵 (hay una diferencia en las proporciones de éxito).
(Esta es la hipótesis alternativa)

Nivel de significancia (α): 0.05.

Usaremos la formula del estadístico Z para las diferencias de proporciones


^p a−^p b
Z=

√ p(1−p)(
1 1
n
a b
+ n)

^p a: es la proporción muestral del Tratamiento A (60100=0.6010060=0.60)


^p b : es la proporción muestral del Tratamiento B (72120=0.6012072=0.60).
^p : Es la proporción combinada la cual teien como formula es

( p= xn a+ xb
=
60+ 72
=
132
a+n b 100+ 12 0 220
≈ 0.6 0)

na y nb : Son son los tamaños de las muestras de los tratamientos A y B,


respectivamente.

Al sustituir esto da como resultado 0


El valor critico de Z corresponde a ± 1,96. Por ende
|0| < 1.96
.

Aprendizaje y utilización de SPSS-25:


SPSS es una herramienta poderosa para el análisis de datos que ofrece una
amplia gama de funciones estadísticas y de visualización. Aprender a utilizar
SPSS-25 puede abrir nuevas oportunidades para explorar datos, realizar
análisis detallados y generar resultados significativos. Con una interfaz intuitiva
y numerosas funciones, SPSS-25 facilita el proceso de análisis de datos, lo que
lo convierte en una herramienta valiosa para investigadores, analistas y
profesionales en diversos campos.
Ejemplo:
Si un estudiante de psicología quiere analizar los datos de su estudio sobre la
relación entre el estrés y el rendimiento académico utilizando SPSS-25,
aprenderá a utilizar este software para realizar análisis estadísticos y generar
resultados significativos que contribuyan al conocimiento en su campo.

También podría gustarte