Práctica 7 Intervalo de Confianza

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 6

Práctica 7

INTERVALOS DE CONFIANZA
Objetivos
1. Obtener un intervalo de confianza para la media de una población normal.
2. Obtener un intervalo de confianza para la diferencia de medias de dos poblaciones
normales independientes.
3. Obtener un intervalo de confianza para la diferencia de medias de dos poblaciones
normales relacionadas.

Introducción
El objetivo de la estimación por intervalos de confianza es obtener un intervalo, en el
cual se encuentra el verdadero valor del parámetro con una determinada probabilidad.
Dicha probabilidad se denomina nivel de confianza (1−α), donde α es el nivel de
significación.
En término generales, la construcción de un intervalo de confianza para un parámetro
desconocido θ consiste en encontrar dos funciones de los valores muestrales
1∗ (X1 , X2 , ⋯ , Xn ) y ∗2 (X1 , X2 , ⋯ , Xn ) siendo 1∗ ≤ ∗2 .
tales que Pr(1 ≤  ≤ ∗2 ) = 1 −  para algún  > 0.

Entonces se puede decir que 1∗ y ∗2 determinan un


intervalo que tiene la probabilidad 1 −  de contener
al parámetro .

 𝟏 − 𝛂 recibe el nombre de nivel de confianza,


 α es un número pequeño comprendido entre 0 y 1, 0 < α < 1 (usualmente próximo a
0). Es el riesgo de que el intervalo no contenga el valor del parámetro a estimar θ, por
lo que α recibe el nombre de nivel de significación del intervalo,
∗ ∗
 1 y 2 son respectivamente el límite inferior y superior

Este intervalo recibe el nombre Intervalo de confianza al nivel 𝟏 − 𝛂 del parámetro  .


Se desea un nivel de confianza cercano a la unidad y de menor amplitud posible.
SPSS proporciona intervalos de confianza para:
 Media poblacional con varianza desconocida
 Diferencia de medias en poblaciones independientes con varianzas desconocidas
 Diferencia de medias en poblaciones relacionadas.

Intervalo de confianza para la media de una población normal


SPSS construye intervalos de confianza para la media en el caso de varianza desconocida.
Intervalo de confianza para la media de una distribución N(μ, σ) con varianza
desconocida
Sea una muestra aleatoria simple, X1 , X 2 , ⋯ , Xn extraída de una población normal con
media μ, y desviación estándar  , ambos parámetros desconocidos. Se desea hallar un
intervalo de confianza para la media poblacional μ. Para ello, consideremos el pivote
(variable aleatoria):
X − |

C=

̂⁄√n − 1
Su distribución es una t-Student con 𝐧 − 𝟏 grados de libertad.
Se lee en la tabla de Student el valor del cuantil t1−,n−1 que cumple con
2
X−
̅
Pr (−t1−,n−1 ≤ ≤ t1−,n−1)
2 
̂⁄√n − 1 2

̂ 
̂
= Pr (X̅−t 
1− ,n−1
≤≤̅ X + t1−,n−1 )= 1−
2 √n − 1 2 √n − 1

Dado que se verifica la siguiente relación n ̂ 2 = (n − 1)S 2 , se tiene la siguiente


expresión del intervalo de confianza para μ
S S
̅−t 
Pr (X 1− ,n−1
≤  ≤ ̅
X + t 
1− ,n−1
) =1−
2 √n 2 √n
̅ − t1−,n−1 S ≤  ≤ X
La probabilidad de que el intervalo de confianza (X ̅ + t1−,n−1 S )
2 √ n 2 √ n
contenga el verdadero valor de la media μ es 1 − α.
Para realizar un intervalo de confianza para la media de una población normal mediante
SPSS se selecciona, en el menú principal,
Analizar/Estadísticos descriptivos/Explorar…
Pasar a la ventana Dependientes: la variable a analizar VAR1
Por defecto SPSS calcula el intervalo de confianza a un nivel del 95%, para
modificar este nivel se pulsa Estadísticos…
Para obtener el intervalo se pulsa Continuar y seguidamente Aceptar.
Alternativamente este intervalo de confianza también se obtiene seleccionando en el
menú principal Analizar/Comparar medias/Prueba T para una muestra…
Pasar la variable a la ventana Contrastar variables: y en el campo Valor de
prueba se deja el valor 0 que viene por defecto.
El nivel de confianza se puede modificar pulsando el botón Opciones…
Para obtener el intervalo se pulsa Continuar y seguidamente Aceptar.
Ejemplo
En una muestra de nueve preparados de jugo de tomate se ha obtenido los siguientes
datos del contenido de vitamina C en mg/100 cm3.
21.60 19.72 18.92 23.01 17.98 22.06 25.01 21.98 20.80
Supuesto que el contenido de vitamina C del jugo de tomate se distribuye
normalmente. Se pide:
a. Estimar el contenido medio, en vitamina C, del jugo de tomate
b. Calcular un intervalo de confianza al 95% para dicha cantidad.
Salidas
Por lo tanto, hay un 95% de confianza de que el intervalo (𝟏𝟗. 𝟓𝟕, 𝟐𝟐. 𝟖𝟗) contenga al
contenido medio, en vitamina C, del jugo de tomate.
Intervalo de Confianza para la diferencia de medias en muestras independientes
Dos muestras son independientes cuando los datos de una de ellas no 1614 1
condicionan a los datos de la otra. 1094 1
Supongamos que X e Y son dos variables aleatorias independientes y 1293 1
tales que X~N(μX, σX ) e Y~N(μY , σY ) 1643 1
Sean (X1 , X2 , … , Xnx ) una m.a.s.1 de tamaño nX extraída de la población 1466 1
normal N(μX , σX ). 1270 1
Sean (Y1 , Y2 , … , YnY ) una m.a.s. de tamaño nY extraída de la población 1340 1
normal N(μY , σY ). 1380 1
Interesa comparar las dos medias poblaciones, se puede construir un 1028 1
intervalo de confianza para μX − μY para el caso de varianzas 1497 1
poblacionales desconocidas. 1383 2
El pivote es la variable de Student con nX + nY − 2 grados de libertad 1138 2
̅−Y
|(X ̅) − (μX − μY )| 1092 2
C= 1143 2
1 1
Sp √n + n 1017 2
X Y
donde la varianza común es la media de las varianzas ponderada por sus 1061 2
respectivos grados de libertad2 1627 2
(nX −1)S2X +(nY −1)S2Y 1021 2
Sp2 =
nX +nY −2 1711 2
Por lo tanto, el intervalo de confianza para la diferencia de medias se 1065 2
determina de la siguiente forma


X−̅
Y ) − (μ X − μ Y )
Pr −t1−,n +n −2
≤ ≤ t1−,n +n −2 = 1 − 
2 X Y 1 1 2 X Y
S p √n + n
[ X Y ]
Luego se obtiene el intervalo de confianza al nivel 1 − :

1 1
̅−̅
𝐼𝐶1− (μX − μY ) = ((X Y) ± t1−,n Sp √ + )
2 X +nY −2 nX nY

SPSS construye intervalos de confianza para la diferencia de medias en el caso de


varianzas poblacionales desconocidas.
Para la realización de dichos intervalos los datos se deben introducir de la siguiente forma:
Se crean dos variables, una de ellas contiene todas las observaciones y la otra variable es
una variable indicadora del grupo al que pertenece cada uno de los valores observados.
Se selecciona, en el menú principal,
Analizar/Comparar medias/Prueba T para muestras independientes…
Se introduce en el campo Contrastar variables: la variable que contiene los
valores observados y en el campo Variable de Agrupación: la variable que indica
la muestra a la que pertenece cada uno de los valores
A continuación se definen los dos grupos que determinan cada una de las muestras,
para ello se pulsa el botón Definir grupos…

1
muestra aleatoria simple
2
Supuesto de una distribución uniforme de la varianza en la muestra global. p de “pooled” que significa
agrupado.
Se introducen los valores asignados a cada muestra y se pulsa Continuar. El nivel
de confianza, se puede modificar en Opciones…
Se pulsa Continuar y Aceptar

Ejemplo
Dos laboratorios A y B realizan determinaciones de nicotina en 4 unidades de
tabaco, con los resultados siguientes:
Lab. A: 16, 14, 13, 17 Lab. B: 18, 21, 18, 19
Suponiendo que las dos poblaciones examinadas son normales e independientes con
igual varianza, estimar la diferencia del contenido medio en nicotina del tabaco a un
nivel de confianza del 95%.
Se introducen los datos
Se selecciona, en el menú principal, Analizar/Comparar medias/Prueba T para
muestras independientes…
Se pulsa Definir grupos….
Se introducen los valores asignados a cada muestra y se pulsa Continuar y
Aceptar. Se obtienen las siguientes salidas

En este caso la prueba de Levene muestra un p-valor igual a 0.356, al ser mayor que el
nivel de significación 0.05, indica que se mantiene la hipótesis nula “igualdad de
varianzas” con un nivel de confianza del 95%. Por tanto, el intervalo de confianza
resultante es aquel en el que “Se han asumido varianzas iguales” (−6.825, −1.175). De
este resultado se deduce que el contenido medio de nicotina difiere de un laboratorio a
otro, (el intervalo no contiene al 0), siendo dicho contenido mayor en el laboratorio B que
en laboratorio A.
Intervalo de confianza para la diferencia de medias en muestras relacionadas
En las muestras apareadas, cada observación de una muestra está emparejado con una
observación de la otra muestra, por lo tanto se considera parejas de valores (x, y).
Sean X e Y dos variables normales, X~N(μX , σX ) y Y~N(μY, σY ).
La diferencia D = X − Y es otra variable normal D~N(μD , σD ). Dado una muestra
aleatoria de diferencias, Di = Xi − Yi , 1 ≤ i ≤ n , su valor medio D̅ es la diferencia de
las medias de X e Y, D = X − Y , su varianza D = Var(X − Y) = 2X + 2Y − 2 XY.
2

Por lo tanto el problema original de realizar una inferencia sobre dos muestras se reduce
al problema de realizar la inferencia sobre una muestra que consiste en construir un
intervalo de confianza para la media de la población de diferencias. Para la realización de
este intervalo de confianza recurrimos a los métodos utilizados anteriormente. En
particular, construyamos el intervalo de confianza para D = X − Y .
̅ −
D D
Para ello, consideremos la variable de Student C = con n − 1 grados de libertad.
SD ⁄√n
Se determina el valor del cuantil t1−,n−1 que cumple con
2
̅−
D D
Pr (−t1−,n−1 ≤ ≤ t1−,n−1 )
2 SD ⁄√n 2
SD SD
̅−t 
= Pr (D 1− ,n−1
≤ D ≤ D
̅+t 
1− ,n−1
) =1−
2 √n 2 √n
donde D̅ y SD son la media muestral y la desviación típica de la muestra de diferencias,
respectivamente.
Para realizar un intervalo de confianza para la diferencia de medias en 16 22
muestras relacionadas mediante SPSS, se introducen los datos de cada 14 23
muestra en una columna del Editor de Datos de SPSS 13 45
Se selecciona, en el menú principal, Analizar/Comparar medias/Prueba 17 8
T para muestras relacionadas… 18 58
Se seleccionan simultáneamente los pares de variables que se desean 21 23
comparar y se pasan a Variables relacionadas: 18 17
En Opciones… se puede cambiar el nivel de confianza 19 28
Se pulsa Continuar y Aceptar.
Ejemplo
Se realiza un estudio, en el que participan 10 individuos, para investigar el efecto del
ejercicio físico en el nivel de colesterol en plasma. Antes del ejercicio se tomaron
muestras de sangre para determinar el nivel de colesterol de cada individuo.
Después, los participantes fueron sometidos a un programa de ejercicios. Al final de
los ejercicios se tomaron nuevamente muestras de sangre y se obtuvo una segunda
lectura del nivel de colesterol. Los resultados se muestran a continuación:
Nivel previo 182 230 160 200 160 240 260 480 263 240
Nivel posterior 190 220 166 150 140 220 156 312 240 250
Construir un intervalo de confianza de 𝛍𝐃 para un nivel de confianza del 95%
Se introducen los datos
Se selecciona, en el menú principal, Analizar/Comparar medias/Prueba T para
muestras relacionadas… Y en el cuadro de diálogo resultante se seleccionan
simultáneamente los pares de variables que se desean comparar y se pasan a
Variables relacionadas:
Se pulsa Aceptar y se muestran las siguientes salidas

Por lo tanto, podemos tener un 95% de confianza en que la diferencia media de niveles
de colesterol en plasma está entre -3.789 y 77.989. Es decir, podemos tener un 95% de
confianza de que el nivel medio de colesterol se reducirá como mínimo en 0.475 unidades.
Ejercicio 1
Se desea comprobar el efecto de 2 fertilizantes (A y B) sobre la producción de unos
árboles frutales, para ello se toman dos grupos de 8 y 10 árboles seleccionados
aleatoriamente y se le añade al agua de riego de cada uno de los grupos de árboles
el fertilizante A y B, respectivamente. La producción en ese año fue la siguiente (en
Kg):
Fertilizante A 30 25 28 29 30 31 24 22 25 27
Fertilizante B 28 27 28 28 26 27 26 29
Se pide:
1. Obtener un intervalo de confianza al 99% para la producción media de los
árboles tratados con el Fertilizante A y para la producción media de los árboles
tratados con el Fertilizante B
2. Obtener un intervalo de confianza al 98% para la diferencia entre la producción
media de los árboles tratados con el Fertilizante A y con el Fertilizante B

Ejercicio 2
Se desea estudiar si la longitud del pico en una especie de loro es distinta entre los
machos y las hembras. Para ello se selecciona una muestra de 14 machos y 12
hembras, cuyos resultados, expresados en milímetros, se muestran en la siguiente
tabla:
Machos 57 58 60 58 61 62 61 59 57 63 58 55 59 60
Hembras 55 56 58 54 53 55 57 53 54 54 55 55
Se pide:
1. Obtener un intervalo de confianza a un nivel del 99%
 para la longitud media del pico en los machos
 para la longitud media del pico en las hembras
2. Obtener un intervalo de confianza a un nivel del 99% para la diferencia entre la
longitud media del pico de los machos y de las hembras.

Ejercicio 3
Para comprobar si un determinado pienso puede mejorar la producción de lana de
las ovejas, se selecciona una muestra aleatoria simple de 10 ovejas para ser
alimentadas con dicho pienso. En la tabla siguiente se muestra el peso (en Kg) de la
lana producida antes y después del experimento
Antes 10 8 7 5 9 12 10 9 8 8
Después 10 9 9 7 10 12 11 12 11 10
Obtener un intervalo de confianza al 98% para la diferencia de los pesos medios de
la lana producida antes y después del experimento.

También podría gustarte