Guia Didáctica
Guia Didáctica
Guia Didáctica
Fotografı́a de la Portada: 7 llaves de las antiguas 7 puertas de la ciudad. Museo de los Fueros.
Sepúlveda.
Guı́a Didáctica
1.1. Introducción
La presente Guı́a Didáctica es un documento que sirve de apoyo y referencia
al curso. En ella se incluye el Programa, las horas y formas de tutorı́as, las
instrucciones para instalar el software, orientaciones y sugerencias de cómo
organizar el estudio de los temas (Cronograma) y un Anexo con diez problemas
que servirán para evaluar al alumno.
1.2. Contenido
El Programa del curso es el siguiente
Métodos Clásicos:
1. Componentes Principales.
2. Análisis de Correspondencias.
3. Escalado Multidimensional.
4. Análisis de Conglomerados (clusters).
5. Análisis Discriminante.
6. Análisis Factorial.
7. Modelos Log-lineales.
8. Regresión Logı́stica.
9. Regresión Poisson.
10. Regresión no Lineal y Regresión Suavizada.
11. Análisis de la Varianza con Medidas Repetidas.
12. Series Temporales.
13. Control Estadı́stico de la Calidad.
14. Data Mining.
3
4 Alfonso Garcı́a Pérez
Métodos Robustos:
15. Introducción a los Métodos Robustos.
16. Estimación Puntual Robusta.
17. Intervalos y Tests Robustos para una población.
18. Intervalos y Tests Robustos para dos poblaciones.
19. Análisis de la Varianza Robusto.
20. Análisis de la Correlación y Estimación Multivariante Robustos.
21. Regresión Robusta.
Métodos de Remuestreo:
22. El Jackknife.
23. El Bootstrap. Aplicaciones a los Métodos anteriores.
Tratamiento Informático:
24. Tratamiento Informático de los Métodos anteriores con BMDP, SAS,
SPSS, S-PLUS y R.
• Tratamiento Informático y
• Estadı́stica Avanzada Aplicada con SPSS,
a:\\paises
Capı́tulo 1. Guı́a Didáctica 5
d:\\datos\\paises
El alumno también dispone de ficheros en BMDP, SAS y SPSS con los que
podrá realizar ejemplos con dichos paquetes estadı́sticos. Lógicamente no se
incluyen estos paquetes estadı́sticos por dos razones: una es su elevado precio
(puede que más de 20.000 euros) y otra, que con ellos básicamente sólo va a
poder ejecutar Métodos Clásicos, mientras que con el software que le hemos
enviado va a poder ejecutar todos los Métodos Estadı́sticos del Programa.
http://www.uned.es/experto-metodos-avanzados/
c:\r\bin\Rgui
aunque, una vez instalado el software enviado en el disco duro del ordenador,
lo más interesante es crearse un Acceso directo a dicho software. Para ello, con
el Explorador de Windows vaya a
Capı́tulo 1. Guı́a Didáctica 7
c:\r\bin
A partir de aquı́ ya puede leer la Sección 1.1 del texto de Tratamiento In-
formático. No obstante, le adelantamos que ejecute como ejecute el programa,
para salir de él, deberá teclear
q()
Si duda en algún momento, utilice los cauces de las tutorı́as que aparecen
en el punto 7 de más abajo, para que contestemos a sus preguntas.
1.6. Profesorado
teléfono: 91 398 72 51
fax: 91 398 66 97
e-mail: [email protected]
bien por teléfono, fax, e-mail, correo ordinario o de forma presencial (para esta
última modalidad, es imprescindible solicitarlo previamente).
1.8. Calificación
Para obtener una calificación positiva del curso, el alumno deberá enviar
resueltos los ejercicios del Anexo de la Guı́a Didáctica a Alfonso Garcı́a Pérez,
Departamento de Estadı́stica, Facultad de Ciencias, UNED, Paseo Senda del
Rey, 9. 28040-Madrid, antes del dı́a 15 de septiembre próximo.
Alternativamente, los puede enviar por e-mail a
ANEXO
Problema 1
Se clasificó a 177 personas casadas según su estatus de fumador, variable B,
con valores No Fumador, b1 , Poco Fumador, b2 (< 6 cigarrillos/dı́a), Fumador
Moderado, b3 (≥ 6 y < 15 cigarrillos/dı́a) y Gran Fumador, b4 (≥ 15 ciga-
rrillos/dı́a), y el de su pareja, variable A, con valores No Fumador, a1 , Poco
Fumador, a2 (< 6 cigarrillos/dı́a), Fumador Moderado, a3 (≥ 6 y < 15 cigarri-
llos/dı́a) y Gran Fumador, a4 (≥ 15 cigarrillos/dı́a). Los resultados aparecen
recogidos en la siguiente tabla:
Problema 2
Se eligieron al azar 29 pacientes afectados de hipertensión a los que se
clasificó según fueran varones, A1 , o hembras, A2 , con objeto de investigar las
diferencias entre pacientes jóvenes B1 (de edad ≤ 45 años) y pacientes viejos
B2 (con edad > 45 años).
Los datos vienen recogidos en las siguientes tablas en donde los pacientes
fueron divididos según se vieran afectados de frecuentes depresiones, C2 , o no
se vieran afectados de frecuentes depresiones, C1
9
10 Alfonso Garcı́a Pérez
C1 B1 B2 Total C2 B1 B2 Total
A1 2 3 5 A1 11 1 12
A2 2 5 7 A2 4 1 5
Total 4 8 12 Total 15 2 17
Analizar, a un nivel de significación α = 0′ 05, la posible independencia de las
tres variables observadas: Sexo, Edad y Depresión, a partir de los datos
anteriores, mediante un modelo Log-Lineal.
Problema 3
Se desea realizar una Regresión no Lineal ajustando una función tipo sig-
moide a los siguientes pares de datos,
x 19 25 38 47 53 69
y 65 61 56 28 12 10
utilizando la correspondiente función de autoarranque. Determinar la función
sigmoide ajustada.
Problema 4
Se desea estudiar el número de hembras de la mosca tropical americana
(Dermatobia hominis) en una determinada región. Dicha mosca se caracteriza
por poner sus huevos en un mosquito, pasando las larvas de la mosca a la piel
de la persona cuya sangre ha chupado el mosquito.
Examinada la región en cuestión en 10 dı́as elegidos al azar, se obtuvo el
siguiente número de moscas hembra de la citada especie:
2, 1, 3, 5, 7, 2, 1, 2, 3, 2
Se pide:
a) Determinar la estimación clásica y cuatro estimaciones robustas del núme-
ro medio de moscas hembra en la región en estudio. ¿Con qué estimación
concluirı́a?
b) Determinar también la estimación clásica y cuatro estimaciones robustas de
la desviación tı́pica del número de moscas hembra en la citada región. ¿Con
qué estimación concluirı́a?
Problema 5
Los tiempos, en minutos, que esperaron, hasta que fueron atendidos en un
determinado banco, diez clientes elegidos al azar fueron los siguientes: 1′ 5, 2,
2′ 5, 3, 1, 5, 5′ 5, 4′ 5, 3, 3. Determinar un intervalo de confianza de coeficiente
de confianza 0′ 95, para la media 0′ 2-recortada del tiempo de espera y otro
Capı́tulo 2. ANEXO 11
Problema 6
Se quiere averiguar si, en promedio, existen diferencias significativas entre
los precios de dos restaurantes, A y B. Para ello se eligieron al azar 11 dı́as en
los que se anotó el precio del menú del dı́a en el restaurante A y otros 11 dı́as
en los que se anotó el precio del menú del dı́a en el restaurante B. Los datos
obtenidos fueron los siguientes:
A 1325 1500 995 1250 1290 1900 1500 1100 1250 1150 1900
B 1100 1400 1000 1300 1300 1700 1250 1200 1150 1200 1700
Problema 7
Se quiere averiguar si tres fertilizantes, A, B y C presentan diferencias
significativas en cuanto a sus efectos sobre el aumento de la cosecha.
Con este propósito se eligieron al azar 15 parcelas a las que se fertilizó alea-
toriamente con cada uno de los fertilizantes en cuestión. Los aumentos de
cosecha obtenidos fueron los siguientes:
Problema 8
Se cree que la duración del revestimiento de un estanque depende de la
cantidad de cal hidráulica que contiene. Para analizar esta relación se midió, en
siete revestimientos, el tiempo, Y , hasta la aparición de filtraciones, teniendo
cada uno de los revestimientos diferentes porcentajes de cal hidráulica, X. Los
resultados obtenidos fueron los siguientes:
12 Alfonso Garcı́a Pérez
X 4 10 80 45 25 60 90
Y 12 26 180 132 100 200 230
Se pide:
a) La recta de M -regresión óptima.
b) La recta de regresión media biponderada.
c) La recta de regresión winsorizada.
Problema 9
Para los datos del Problema 4 anterior, determinar la estimación jackknife
del sesgo de los estimadores del número medio de moscas hembra en la región
en estudio, corregir las estimaciones allı́ obtenidas obteniendo los estimadores
jackknife de sesgo reducido y concluir con una estimación robusta y con menor
sesgo del parámetro de localización en estudio.
Problema 10
Para los datos del Problema 5 anterior, utilizando la media 0′ 2-recortada
muestral, determinar, indicando la expresión R a ejecutar: a) el intervalo
bootstrap-t ideal, b) el intervalo bootstrap-t, c) el intervalo percentil y d)
el de sesgo-corregido y acelerado BCa , en todos los casos para un coeficiente
de confianza 0′ 95.