Estadística Ángeles Pastor Estefania Chávez Colin Naomi Ávila Diaz Cesar Guiovanny Teoria Del Muestreo
Estadística Ángeles Pastor Estefania Chávez Colin Naomi Ávila Diaz Cesar Guiovanny Teoria Del Muestreo
Estadística Ángeles Pastor Estefania Chávez Colin Naomi Ávila Diaz Cesar Guiovanny Teoria Del Muestreo
La teoría del muestreo es el estudio de la relación que existe entre una población y las muestras
que se obtienen de esa población. Un ejemplo sean estimar las cantidades poblacionales
desconocidas (como la media y la varianza poblacional) llamados parámetros, a partir de las
cantidades muestrales (como la media y la varianza muestrales) llamados estadísticos.
La vía para determinar si las diferencias que se observan entre 2 muestras se deben a variaciones
causales, o si son diferencias realmente significativas, es decir, el hecho de saber que un proceso
de producción es mejor que otro, nos lleva a pruebas de significación o de hipótesis.
Estas situaciones descritas arriba son llamadas inferencias que se hacen de una población a partir
de sus muestras, por lo que el cálculo de esta inferencia se realiza mediante el uso del teorema de
probabilidad conocida como inferencia estadística.
Una manera de obtener una muestra aleatoria (o representativa) esto para que cada uno de sus
miembros de la población tenga la misma posibilidad de ser incluida en la muestra, es que a cada
miembro se le asigne un número. El número se escribe en un papel este se coloca en una urna
teniendo cuidado de mezclar muy bien antes de realizar una extracción.
-Población finita, en la cual podemos ir sacando los números sin reposición (no se devuelven los
números en la urna), ya que el numero puede ser extraído varias veces.
DISTRIBUCIONES MUESTRALES
5) A cada distribución del estadístico se le puede calcular su media, su desviación estándar, etc.,
esto es se puede hablar y obtener la media de la distribución muestral de medias
6) Ecuaciones de Distribución muestrales.
𝜎 𝑁𝜌 −𝑁
𝜇𝑥̅ = 𝜇 y 𝜎𝑥̅ = √𝑁 …. 1)
√𝑁 𝜌 −1
Ejemplo:
Considerar todas las muestras de tamaño 2 que pueden extraerse de esta población, las muestras
son repetición
Hallar:
a) La media de la población.
b) La desviación estándar de la población.
c) La media de la distribución de medias.
d) La desviación estándar de la distribución de medias.
Muestras:
Así 𝜇 = 𝜇𝑥̅
2.5, 4, 5, 6.5
3.29 5−2 3
4.5, 5.5, 7, 7 → 𝜇𝑥̅ = 6.0 , 𝜎𝑥̅ = = √5−1 = 2.32√4 = 2.01
√2
8.5, 9.5
Cuando se debe tomar decisiones conjeturas es útil hacer suposiciones o conjeturas, acerca de las
poblaciones relacionadas, las suposiciones que pueden ser verdaderas o no, se llaman hipótesis
estadísticas.
A menudo se llaman hipótesis nulas 𝐻𝑜 , 6 hipótesis alternativas 𝐻𝑖 . 𝐻𝑜 se dan cuando las
diferencias observadas son simplemente debidas a fluctuaciones en el muestreo de la misma
población.
Los procedimientos que permiten decidir si se acepta o descarta una hipótesis o que determinan si
las muestras observadas difieren de manera significativa de los resultados esperados se conocen
como pruebas de hipótesis.
Se dice que se ha cometido un error tipo 1 si se rechaza una hipótesis o que determinan si las
muestras observadas difieren de manera significativa de los resultados esperados se conocen
como pruebas de hipótesis que se ha cometido
Se dice que se ha cometido un error tipo 1si se rechaza una hipótesis cuando es cierta.
Al comprobar una hipótesis, la probabilidad máxima relacionada con un error tipo1, se llama nivel
de significancia.
Nivel de significancia ∝
𝑥̅ −𝑎
𝜎/√𝑁
< 1.645 prueba de una cola
∝= 0.05
Razones de varianzas
𝑠̂12
𝐹0.05 ≤ ≤ 𝐹0.95 𝐻𝑂 : No hay diferencias entre las varianzas poblacionales 𝜎12 = 𝜎22
𝑠̂22
La inferencia estadística se ocupa de poder inferir información acerca de una población a partir de
muestras obtenidas de ella. Por ejemplo, un problema importante de la inferencia estadística es la
estimación de parámetros (puede ser media y varianzas poblacionales), a partir media de los
estadísticos (pueden ser media y varianzas muestrales).
Si la media de lo distribución muestral de un estadístico es igual al parámetro poblacional
correspondiente se dice que el estadístico es un estimador sesgado. A los valores de estos
estadísticos se les llama estimaciones insesgadas o sesgadas.
Si se consideran todos los estadísticos cuya distribución muestral tiene una misma media, al
estadístico que tiene la menor varianza suele llamársele estimador más eficiente o mejor del
parámetro correspondiente.
Las estimaciones por intervalo dan la precisión o exactitud de la estimación y por eso son
preferibles.
En forma general se puede hallar (o se puede tener confianza de hallar) 𝜇𝑠 en los intervalos 𝑠 − 𝜎𝑠
a 𝑠 + 𝜎𝑠 , 𝑠 − 2𝜎𝑠 a 𝑠 + 2𝜎𝑠 o 𝑠 − 3𝜎𝑠 a 𝑠 + 3𝜎𝑠 , a 68.27, 95.45 y 99.73% de las veces,
respectivamente, debido a elle, a estos intervalos se les llama intervalos de confianza de 68.27%,
95.45% y 99.73%
Para estimar 𝜇𝑠 . A los números de los extremos de estos intervalos (𝑠 ± 𝜎𝑠 , 𝑠 ± 2𝜎𝑠 y 𝑠 ± 3𝜎𝑠 ) se
les llama límites de confianza de 95% y de 99% (o de 0.95 y 0.99) para 𝑆. Al porcentaje de
confianza se le suele llamar nivel de confianza, a los números 1.96 y 2.58, etc., que aparecen en los
límites de confianza o valores críticos y se denotan como 𝑧𝑐 . A partir de los niveles de confianza se
pueden encontrar los coeficientes de confianza y viceversa.
Nivel de confianza 𝑧𝑐 99.73% 99% 98% 96% 95.45% 95% 90% 80%
68.67% 50%
1.0 0.6745
𝜎 𝑁𝑝 −𝑁
𝑥̅ ± 𝑧𝑐 √𝑁 para poblaciones de tamaño finito 𝑁𝑝 y muestreo sin reemplazo.
√𝑁 𝑃 −1
Distribución 𝒙𝟏 − 𝑪𝒖𝒂𝒅𝒓𝒂𝒅𝒂
𝑥 2 = 𝑥1 2 + 𝑥2 2 + ⋯ + 𝑥𝑣 2
Ejemplo:
Determinar los valores de 𝑥 2 para los que el área de la cola derecha de la distribución 𝑥 2 es 0.05 si
el numero de grados de libertad 𝑣 es igual
a) 15, b) 21, c) 50
La grafica es:
Asi 1 − 𝑃 = 0.05
→ 1 − 0.05 = 𝑃
→ 0.95 = 𝑃
Solucion:
1 − 𝑃 = 0.025
→ 1 − 0.025 = 𝑃
𝑃 = 0.975
→ 𝑥0.975 y 𝑉 = 5 → 𝑃 = 12.8
→ 1 − 0.975 = 𝑃
𝑃 = 0.025
Así 𝑥0.025 y 𝑣 = 5 el área es 0.831
→ 1 − 𝑃 = 0.025 → 𝑃 = 1 − 0.025
𝑃 = 0.975
Así buscamos 𝑣 = 9 y 𝑡0.975 = 2.26
Ejercicios:
Distribución F
Una variable aleatoria tiene distribución F con 𝑣1 y 𝑣2 grados de libertaf si su función de densidad
esta dada por:
𝑣 +𝑣
𝛤( 1 2)
𝑓 (𝑢 ) = { 𝑣
2
𝜈 𝑣1 𝑣1/2 𝑣2 𝑣2/2 𝑢(𝑣1/2)−1 (𝑣1 + 𝑣1 𝑢)− 𝑣1+𝑣2/2 ; 𝑢 > 0
𝛤( 1)𝛤( 2)
2 2
𝑢≤0
Observaciones:
b)F0.99,15,9
𝑣1 = 15
𝑣2 = 9 𝐹0.99,15,9 = 4.96
a)
→ 𝑃 = 0.95
𝑃1 = 10 → Usar tabla de 0.95
𝑉2 = 15
F0.95,10,15 = 2.54
1 1
𝑐)𝐹0.05,8,30 = = = 0.325
𝐹0.95,30,8 3.08
a) 𝐹0.95,15,12
𝑃 = 0.95
𝑣1 = 15 tabla de 0.95
𝑣2 = 12
𝐹0.95,15,12 = 2.62
b) 𝐹0.99,120,60
𝑃 = 0.99
𝑣1 = 120 tabla de 0.99
𝑣2 = 60
𝐹0.99,120,60 = 1.73
c) 𝐹0.99,60,14
𝑃 = 0.99
𝑣1 = 60 tabla de 0.99
𝑣2 = 14
𝐹0.99,60,14 = 3.18
d) 𝐹0.01,30,12
1 − 0.01 = 0.99
1 1
= = 0.35
𝐹0.01,12,30 2.84
e) 𝐹0.01,8,8
1 − 0.01 = 0.99
1 1
= = 0.17
𝐹0.01,8,8 6.03
Aplicaciones
Tomado todas las posibles muestras aleatorias de tamaño N de una población y calculando la
varianza de cada muestra, se obtiene una distribución muestral de 𝑠 2 o 𝑠̂ 2 , es conveniente
obtener la distribución muestral de la variable aleatoria.
Esta variable muestral tiene una distribución 𝑥̅ 𝑖 cuadrada con𝑁 − 1 grado de libertad.
2 𝑁𝑠 2 2
𝑥0.025 ≤ 𝜎2
≤ 𝑥0.975
ó
̂2
(𝑁−1)𝑠
2 2
𝑥0.025 ≤ ≤ 𝑥0.975
𝜎2
De manera equivalente
𝑠√𝑁 𝑠√𝑁
≤𝜎≤
𝑥0.975 𝑥0.975
ó con 95% de confianza
𝑠̂ √𝑁 − 1 𝑠̂ √𝑁 − 1
≤𝜎≤
𝑥0.975 𝑥0.025
Ejemplo:
2
Así 𝑥0.975 = 27.5 𝑣 = 16 − 1 = 15
𝑥0.975 = 5.24
2
𝑥0.025 = 6.26 𝑣 = 15
𝑥0.025 = 2.5
En este caso se usa la distribución 𝑡. Por ejemplo, si −𝑡0.975 y 𝑡0.975 son los valores de 𝑇 para los
caules 25% del área se encuentra en la cola de la distribución 𝑡, entonces el intervalo de confianza
de 95% de 𝑇.
(𝑥̅ −𝜇)√𝑛
−𝑡0.975 < 𝑠̂
< 𝑡0.975
𝑆̂ 𝑆̂
𝑥̅ − 𝑡0.975 < 𝜇 < 𝑥̅ + 𝑡0.975
√𝑁 √𝑁
𝑆̂
Así se estima 𝜇 con su confianza del 95% o en forma resumida 𝑥̅ ± 𝑡𝑐
√𝑁
Ejemplo: en una muestra de 10 mediciones del diámetro de una esfera se obtuvo una media de
𝑥̅ = 4.38 𝑝𝑢𝑙 y una desviación estándar de 𝑠 = 0.06 𝑝𝑢𝑙.
0.06
b) 4.38 ± 𝑡0.995 ( 3
) 1 − 0.99 = 0.01 → 0.05
0.06
4.38 ± 3.25 ( 3
)
4.38 ± 0.0650
Ajustes de curvas
Modelo lineal: 𝑦 = 𝑏 + 𝑚𝑥
Modelo polinomial: 𝑦 = 𝑐 + 𝑏𝑥 + 𝑚𝑥 2
𝑦 = 𝑑 + 𝑐𝑥 + 𝑏𝑥 2 + 𝑚𝑥 3
Linealización
a) 𝑦 = 𝑎𝑒 𝑏𝑥 exponencial
→ 𝑙𝑛𝑦 = 𝑙𝑛𝑎 + 𝑏𝑥
𝑦 = 𝐵 + 𝑚𝑥
b) 𝑦 = 𝑎𝑥 𝑏 potencial
𝑙𝑛𝑦 = 𝑙𝑛𝑎 + 𝑏𝑙𝑛𝑥
𝑦 = 𝐵 + 𝑚𝑥
∑ 𝑦𝑖 = 𝑛𝑏 + 𝑚 ∑ 𝑥𝑖 + 𝑐 ∑ 𝑥𝑖 2
∑ 𝑦𝑖 𝑥𝑖 = 𝑏 ∑ 𝑥𝑖 + 𝑚 ∑ 𝑥𝑖 2 + 𝑐 ∑ 𝑥𝑖 3 Modelo cuadrático
∑ 𝑦𝑖 𝑥𝑖 2 = 𝑏 ∑ 𝑥𝑖 2 + 𝑚 ∑ 𝑥𝑖 3 + 𝑐 ∑ 𝑥𝑖 4
𝑦𝑖 = ln 𝑦𝑖 𝑥𝑖 = 𝑥𝑖 exponencial
𝑦𝑖 = ln 𝑦𝑖 𝑥𝑖 = ln 𝑥𝑖 potencial
𝑧 = 𝑎 + 𝑏𝑥 + 𝑐𝑦
∑ 𝑧𝑖 𝑥𝑖 = 𝑎 ∑ 𝑥𝑖 + 𝑏 ∑ 𝑥𝑖 2 + 𝑐 ∑ 𝑦𝑖 𝑥𝑖
∑ 𝑧𝑖 𝑥𝑖 = 𝑎 ∑ 𝑦𝑖 + 𝑏 ∑ 𝑥𝑖 𝑦𝑖 + 𝑐 ∑ 𝑦𝑖 2
Ejemplo ajuste de curvas
Modelo lineal
Nota: para un modelo cuadrático ahora es una matriz 3𝑥3, en contraste con el lineal que es una
matriz 2𝑥2