Práctica 7 Intervalo de Confianza
Práctica 7 Intervalo de Confianza
Práctica 7 Intervalo de Confianza
INTERVALOS DE CONFIANZA
Objetivos
1. Obtener un intervalo de confianza para la media de una población normal.
2. Obtener un intervalo de confianza para la diferencia de medias de dos poblaciones
normales independientes.
3. Obtener un intervalo de confianza para la diferencia de medias de dos poblaciones
normales relacionadas.
Introducción
El objetivo de la estimación por intervalos de confianza es obtener un intervalo, en el
cual se encuentra el verdadero valor del parámetro con una determinada probabilidad.
Dicha probabilidad se denomina nivel de confianza (1−α), donde α es el nivel de
significación.
En término generales, la construcción de un intervalo de confianza para un parámetro
desconocido θ consiste en encontrar dos funciones de los valores muestrales
1∗ (X1 , X2 , ⋯ , Xn ) y ∗2 (X1 , X2 , ⋯ , Xn ) siendo 1∗ ≤ ∗2 .
tales que Pr(1 ≤ ≤ ∗2 ) = 1 − para algún > 0.
∗
(̅
X−̅
Y ) − (μ X − μ Y )
Pr −t1−,n +n −2
≤ ≤ t1−,n +n −2 = 1 −
2 X Y 1 1 2 X Y
S p √n + n
[ X Y ]
Luego se obtiene el intervalo de confianza al nivel 1 − :
1 1
̅−̅
𝐼𝐶1− (μX − μY ) = ((X Y) ± t1−,n Sp √ + )
2 X +nY −2 nX nY
1
muestra aleatoria simple
2
Supuesto de una distribución uniforme de la varianza en la muestra global. p de “pooled” que significa
agrupado.
Se introducen los valores asignados a cada muestra y se pulsa Continuar. El nivel
de confianza, se puede modificar en Opciones…
Se pulsa Continuar y Aceptar
Ejemplo
Dos laboratorios A y B realizan determinaciones de nicotina en 4 unidades de
tabaco, con los resultados siguientes:
Lab. A: 16, 14, 13, 17 Lab. B: 18, 21, 18, 19
Suponiendo que las dos poblaciones examinadas son normales e independientes con
igual varianza, estimar la diferencia del contenido medio en nicotina del tabaco a un
nivel de confianza del 95%.
Se introducen los datos
Se selecciona, en el menú principal, Analizar/Comparar medias/Prueba T para
muestras independientes…
Se pulsa Definir grupos….
Se introducen los valores asignados a cada muestra y se pulsa Continuar y
Aceptar. Se obtienen las siguientes salidas
En este caso la prueba de Levene muestra un p-valor igual a 0.356, al ser mayor que el
nivel de significación 0.05, indica que se mantiene la hipótesis nula “igualdad de
varianzas” con un nivel de confianza del 95%. Por tanto, el intervalo de confianza
resultante es aquel en el que “Se han asumido varianzas iguales” (−6.825, −1.175). De
este resultado se deduce que el contenido medio de nicotina difiere de un laboratorio a
otro, (el intervalo no contiene al 0), siendo dicho contenido mayor en el laboratorio B que
en laboratorio A.
Intervalo de confianza para la diferencia de medias en muestras relacionadas
En las muestras apareadas, cada observación de una muestra está emparejado con una
observación de la otra muestra, por lo tanto se considera parejas de valores (x, y).
Sean X e Y dos variables normales, X~N(μX , σX ) y Y~N(μY, σY ).
La diferencia D = X − Y es otra variable normal D~N(μD , σD ). Dado una muestra
aleatoria de diferencias, Di = Xi − Yi , 1 ≤ i ≤ n , su valor medio D̅ es la diferencia de
las medias de X e Y, D = X − Y , su varianza D = Var(X − Y) = 2X + 2Y − 2 XY.
2
Por lo tanto el problema original de realizar una inferencia sobre dos muestras se reduce
al problema de realizar la inferencia sobre una muestra que consiste en construir un
intervalo de confianza para la media de la población de diferencias. Para la realización de
este intervalo de confianza recurrimos a los métodos utilizados anteriormente. En
particular, construyamos el intervalo de confianza para D = X − Y .
̅ −
D D
Para ello, consideremos la variable de Student C = con n − 1 grados de libertad.
SD ⁄√n
Se determina el valor del cuantil t1−,n−1 que cumple con
2
̅−
D D
Pr (−t1−,n−1 ≤ ≤ t1−,n−1 )
2 SD ⁄√n 2
SD SD
̅−t
= Pr (D 1− ,n−1
≤ D ≤ D
̅+t
1− ,n−1
) =1−
2 √n 2 √n
donde D̅ y SD son la media muestral y la desviación típica de la muestra de diferencias,
respectivamente.
Para realizar un intervalo de confianza para la diferencia de medias en 16 22
muestras relacionadas mediante SPSS, se introducen los datos de cada 14 23
muestra en una columna del Editor de Datos de SPSS 13 45
Se selecciona, en el menú principal, Analizar/Comparar medias/Prueba 17 8
T para muestras relacionadas… 18 58
Se seleccionan simultáneamente los pares de variables que se desean 21 23
comparar y se pasan a Variables relacionadas: 18 17
En Opciones… se puede cambiar el nivel de confianza 19 28
Se pulsa Continuar y Aceptar.
Ejemplo
Se realiza un estudio, en el que participan 10 individuos, para investigar el efecto del
ejercicio físico en el nivel de colesterol en plasma. Antes del ejercicio se tomaron
muestras de sangre para determinar el nivel de colesterol de cada individuo.
Después, los participantes fueron sometidos a un programa de ejercicios. Al final de
los ejercicios se tomaron nuevamente muestras de sangre y se obtuvo una segunda
lectura del nivel de colesterol. Los resultados se muestran a continuación:
Nivel previo 182 230 160 200 160 240 260 480 263 240
Nivel posterior 190 220 166 150 140 220 156 312 240 250
Construir un intervalo de confianza de 𝛍𝐃 para un nivel de confianza del 95%
Se introducen los datos
Se selecciona, en el menú principal, Analizar/Comparar medias/Prueba T para
muestras relacionadas… Y en el cuadro de diálogo resultante se seleccionan
simultáneamente los pares de variables que se desean comparar y se pasan a
Variables relacionadas:
Se pulsa Aceptar y se muestran las siguientes salidas
Por lo tanto, podemos tener un 95% de confianza en que la diferencia media de niveles
de colesterol en plasma está entre -3.789 y 77.989. Es decir, podemos tener un 95% de
confianza de que el nivel medio de colesterol se reducirá como mínimo en 0.475 unidades.
Ejercicio 1
Se desea comprobar el efecto de 2 fertilizantes (A y B) sobre la producción de unos
árboles frutales, para ello se toman dos grupos de 8 y 10 árboles seleccionados
aleatoriamente y se le añade al agua de riego de cada uno de los grupos de árboles
el fertilizante A y B, respectivamente. La producción en ese año fue la siguiente (en
Kg):
Fertilizante A 30 25 28 29 30 31 24 22 25 27
Fertilizante B 28 27 28 28 26 27 26 29
Se pide:
1. Obtener un intervalo de confianza al 99% para la producción media de los
árboles tratados con el Fertilizante A y para la producción media de los árboles
tratados con el Fertilizante B
2. Obtener un intervalo de confianza al 98% para la diferencia entre la producción
media de los árboles tratados con el Fertilizante A y con el Fertilizante B
Ejercicio 2
Se desea estudiar si la longitud del pico en una especie de loro es distinta entre los
machos y las hembras. Para ello se selecciona una muestra de 14 machos y 12
hembras, cuyos resultados, expresados en milímetros, se muestran en la siguiente
tabla:
Machos 57 58 60 58 61 62 61 59 57 63 58 55 59 60
Hembras 55 56 58 54 53 55 57 53 54 54 55 55
Se pide:
1. Obtener un intervalo de confianza a un nivel del 99%
para la longitud media del pico en los machos
para la longitud media del pico en las hembras
2. Obtener un intervalo de confianza a un nivel del 99% para la diferencia entre la
longitud media del pico de los machos y de las hembras.
Ejercicio 3
Para comprobar si un determinado pienso puede mejorar la producción de lana de
las ovejas, se selecciona una muestra aleatoria simple de 10 ovejas para ser
alimentadas con dicho pienso. En la tabla siguiente se muestra el peso (en Kg) de la
lana producida antes y después del experimento
Antes 10 8 7 5 9 12 10 9 8 8
Después 10 9 9 7 10 12 11 12 11 10
Obtener un intervalo de confianza al 98% para la diferencia de los pesos medios de
la lana producida antes y después del experimento.