Series de Tiempo
Series de Tiempo
Series de Tiempo
Clasificacin
Clasificamos las series atendiendo a distintos puntos de vista.
Segn la recogida de los datos tenemos:
Continua.
Una serie de tiempo es continua cuando las observaciones son tomadas
continuamente en el tiempo, aun cuando la variable medida slo tome un nmero de
valores finitos.
Discreta.
Una serie temporal es discreta cuando las observaciones son tomadas en tiempos
especficos, normalmente igualmente espaciados. stas sern las que nosotros
estudiaremos; se supondrn los datos en intervalos regulares de tiempo (horas, das, meses,
aos,..). El trmino discreto es usado aun cuando la variable medida sea continua. Las
series discretas pueden surgir de varias maneras:
Muestral.
Dada una serie de tipo continua es posible construir una serie de tipo
discreta, tomando los valores en intervalos de tiempo de igual longitud. Un ejemplo
de serie temporal de tipo continua es la temperatura en un lugar dado, considerando
la temperatura diaria a las tres de la tarde, obtenemos una serie temporal discreta
muestral.
Agregada o acumulada.
Este tipo de series ocurre cuando una variable no tiene valor en un instante
(slo tiene sentido en algunos instantes de tiempo) pero podemos acumular los
valores en intervalos de tiempo igualmente espaciados. Ejemplos: las lluvias
torrenciales, los accidentes de trfico mensualmente, el nmero de pasajeros
mensuales en las lneas areas espaolas. De hecho los accidentes de trfico
mensuales son una agregacin de sucesos discretos. Los valores tomados no se
observan en cada instante sino que se vanacumulando en intervalos de tiempo.
Inherentes o discretas
Las que realmente los datos se obtienen en momentos discretos. Por ejemplo
el salario mensual.
Teniendo en cuenta el nmero de variables que observamos en cada tiempo.
Series temporales univariantes
Cuando interviene una sola variable.
Series temporales multivariantes
Cuando intervienen varias variables.
El primer paso a llevar a cabo en cualquier anlisis de una serie de tiempo es
realizar la representacin grfica de la serie. En el eje horizontal se representa la escala del
tiempo, y en el eje vertical, los valores asignados a los tiempos. Es habitual observar que
los datos aparentemente fluctan a lo largo del tiempo en torno a algn patrn.
Desde un punto de vista formal, este hecho responde al concepto de proceso
estocstico, concepto matemtico que hay subyacente en una serie temporal.
La representacin grfica de una serie de tiempo es la representacin de una
trayectoria del proceso estocstico subyacente. En dicha representacin, podemos observar
las principales fuentes de variacin.
Descomposicin Clsica
Tradicionalmente se establecen cuatro tipos de variaciones: tendencia, efecto
estacional, cambios cclicos y otras variaciones que podemos llamar irregulares.
Efecto estacional:
Muchas series temporales tales como por ejemplo: cifras de ventas, lecturas de
temperatura, etc..., presentan una variacin que se va repitiendo a lo largo de la trayectoria.
Este tipo de variacin, con periodicidad,en general, menor o igual a un ao, se conoce con
el nombre de estacionalidad. Esta componente es debida al entorno en el que se recogen los
datos, ya que la mayoria de procesos varian segn la estacin del ao (navidad, verano etc)
o el da de la semana, horario diurno o nocturno etc. Es fcil de comprender y se puede
calcular, eliminar o modelar.
Cambios cclicos:
Adems de los efectos estacionales algunas series presentan variaciones sin perodo
fijo, debido a algunas otras causas fsicas. Un ejemplo es la variacin diaria de la
temperatura. Tambin se definen ciclos a las variaciones superiores a un ao, debidas
generalmente a las fluctuaciones de la actividad econmica y social. Muchas veces los
datos econmicos quedan afectados por ciclos de negocios variando entre 5 y 7 aos. En
Economa se suelen distinguir tres tipos de ciclos en cunto a su periodicidad: los cortos o
de Kintchine que tienen lugar ms o menos cada tres aos, los medios o de Jutglar cuyo
perodo oscila entre cinco y diez aos y los largos o de Kondratiev que aparecen cada
cuarenta o cincuenta aos. El anlisis de esta componente es dficil pues la duracin de los
ciclos puede no ser constante, razn por la cual cualquier variacin puede dar lugar a una
prediccin errnea.
Otros ciclos son debidos al propio modelo que rige el proceso en estudio.
Tendencia:
Debe recoger el movimiento de la serie a lo largo del tiempo, se puede definir por
tanto como la variacin a largo plazo, pero hemos de precisar lo que entendemos por a
largo plazo. Hay, por ejemplo, series de tiempo que presentan variaciones cclicas, en un
perodo de 50 aos o ms, entonces si disponemos de pocos datos se puede confundir las
variaciones cclicas con la tendencia, sin embargo si disponemos de datos suficientes esta
confusin no se dar. As pues al hablar de tendencia hay que tener en cuenta el nmero de
observaciones de las que se dispone.
Otras variaciones irregulares:
Una vez que la tendencia-ciclo y estacionalidad han sido analizados y eliminadas de
nuestros datos, nos quedamos con una serie de residuos, que pueden ser o no aleatorios.
Veremos varias tcnicas, para el anlisis de series de este tipo, con el objeto de ver si
algunas de las variaciones aparentemente irregulares, pueden ser explicadas en trmino de
modelos probabilsticos, tales como los modelos ARIMA que introduciremos ms adelante.
Enero
235.1
299.5
464.8
264.9
225.8
213.2
356.1
366.9
306.6
320.6
446.4
467.8
411.9
533.5
462.1
462.7
451.8
394.1
324.4
315.9
307.4
287.5
340.6
541.4
544.7
467.5
500.8
818
817.4
784.8
689.7
Febrero
280.7
347.4
479.1
253.8
234
196.4
398.3
356.9
309.2
308.5
511.6
469.8
388.6
565.4
448.1
487
446.1
417.2
310.9
318.4
328.7
292.3
379.4
544.2
541.2
484.5
514
830.9
803.3
810.9
673.9
Marzo
264.6
338.3
431.3
232.3
200.2
182.8
403.7
329.7
309.5
282.2
515.5
429.8
416.4
542.3
432.3
444.2
422.5
369.9
299
295.4
292.9
274.7
373.3
517.5
521.5
451.2
475.5
835.9
752.5
755.6
647.9
Abril
240.7
327.7
366.5
193.8
183.6
176.4
384.6
316.2
271
262.7
506.4
355.8
360.7
488.7
386.3
399.3
383.1
349.2
273
266.4
249.1
254.2
355.2
469.4
469.7
417.4
430.1
782
689
656.8
568.8
Mayo
201.4
351.6
326.3
177
178.2
153.6
365.8
269
279.9
263.5
483.2
332.7
338
467.1
395.2
394.9
352.8
321.4
279.3
245.8
230.4
230
338.4
439.4
434.4
379.9
414.4
762.3
630.4
615.1
545.7
Junio
240.8
396.6
355.1
213.2
203.2
173.2
368.1
289.3
317.9
313.1
522.3
378
417.2
531.3
421.9
455.4
445.3
405.7
359.2
362.8
361.5
339
466.9
549
542.6
484.7
538
856.9
765.5
745.3
632.6
Julio
241.1
438.8
331.6
207.2
208.5
171
367.9
266.2
298.4
284.3
509.8
360.5
388.4
496.1
382.9
414
367.5
342.9
305
324.9
321.7
318.2
451
533
517.3
455
526
820.9
757.7
694.1
643.8
Agosto
223.8
395.6
261.3
180.6
191.8
151.2
347
253.6
246.7
252.6
460.7
334.7
371.1
444
384.2
375.5
355.1
316.5
282.1
294.2
277.2
287
422
506.1
485.7
420.8
488.5
769.6
732.2
675.7
593.1
Septiem
206.1
363.5
249
188.6
172.8
161.9
343.3
233.8
227.3
250.3
405.8
319.5
331.5
403.4
345.5
347
326.2
284.2
250.3
289.5
260.7
295.8
429.2
484
465.8
416.5
520.2
752.2
702.6
643.7
579.7
Octubr
174.7
378.8
205.5
175.4
148
157.2
292.9
228.4
209.1
246.5
375
323.1
353.7
386.3
323.4
339.4
319.8
270.9
246.5
295.2
251
284
425.9
457
447
376.3
504.4
724.4
683.3
622.1
546
Noviem
203.3
357
235.6
199
159.4
201.7
311.5
253.6
259.9
312.7
378.5
363.6
396.7
394.1
372.6
385.8
331.8
288.8
257.9
290.3
257.6
271
460.7
481.5
426.6
405.6
568.5
723.1
709.5
634.6
562.9
Diciem
220.5
369
240.9
179.6
154.5
236.4
300.9
260.1
266
333.2
406.8
352.1
447
404.1
376
378.8
340.9
278.8
266.5
272
241.8
262.7
463.6
469.5
411.6
405.8
610.6
719.5
702.2
588
572.5
Objetivos
Chatfield (1989) describe en su libro "The analysis of time series. An introduction'',
que los objetivos principales del anlisis de una serie temporal son describir, explicar,
predecir y controlar.
Descripcin.
Se trata de un estudio preliminar de la serie para analizar los tipos de variaciones y
ver cmo se comportan los datos. El primer paso, es representar los datos frente al tiempo,
lo cual nos dar una idea sobre las principales variaciones presentes en nuestra serie
temporal; y tener una primera idea sobre el modelo que podemos ajustar. Asimismo
podemos observar si existen tambin datos extraos, es decir, observaciones que no parecen
ser consistentes con el resto de los datos. El tratamiento de estas observaciones es muy
complejo y requiere tener cuidado, pues pueden ser observaciones vlidas y entonces es
importante que el modelo al que ajustemos las tenga en cuenta; o por el contrario, pueden
ser observaciones fuera de lugar, por ejemplo pensemos en errores a la hora de la toma de
la observacin. Otros rasgos que se pueden observar por medio del grfico son los puntos
de cambio, donde por ejemplo hay un cambio de tendencia, de una tendencia creciente se
pasa una tendencia decreciente. En estos casos se suele ajustar modelos diferentes a cada
una de las partes o efectuar un anlisis de intervencin.
Explicacin.
Construir un modelo para explicar el comportamiento de la serie de tiempo en
trminos de otras variables o de ella misma. Cuando las observaciones son tomadas para
dos o ms variables, es posible usar la variacin en una de las series temporales, para
explicar las variaciones en las otras. Esto nos conduce a un mayor conocimiento sobre la
serie dada. Los modelos de regresin dinmica y funcin de transferencia pueden ser tiles
en estos casos. Por ejemplo es interesante ver cmo el nivel del mar es afectado por la
temperatura y la presin, y ver como las ventas estn afectadas por los precios y las
condiciones econmicas.
Prediccin.
Dada una serie de tiempo, podemos estar interesados en la prediccin de futuros
valores de la serie. La prediccin est estrechamente relacionada con los problemas de
control, por ejemplo si podemos predecir que en un proceso de manufactura la variable que
mide la calidad va a estar muy desviada de un determinado valor lmite, entonces podemos
realizar correcciones oportunas para evitarlo.
La prediccin es uno de los objetivos de las series de tiempo. En general, los
mtodos de prediccin se pueden agrupar en mtodos cualitativos o cuantitativos.
Mtodos cualitativos
Los mtodos cualitativos o tambin conocidos como subjetivos, dependen de
la intuicin y no necesariamente dependen de las observaciones pasadas. A pesar de
su falta de rigor, en algunos casos pueden ser bastante apropiados e incluso el nico
mtodo de previsin. Como por ejemplo, en la aparicin de nuevos productos en el
mercado, si estamos interesados en las ventas de un nuevo producto, no se puede
recurrir al volumen de ventas en aos anteriores pues ste no exista. En este tipo de
Mtodo de Holt-Winter
Es una extensin del mtodo anterior que tiene en cuenta la estacionalidad
.- Introduce tendencia y estacionalidad
F(t) = (L(t) + b(t))*S(t-12)
F(t+m) = (L(t) + m*b(t))*S(t-12+m)
Mtodo multiplicativo
Con ecuaciones
Lt
Yt
(1 )( Lt 1 bt 1 )
St s
bt ( Lt Lt 1 ) (1 )bt 1
St
Yt
(1 ) St s
Lt
Ft m Lt bt m St s m
Siendo s la estacionalidad o nmero de estaciones en un ciclo.
Para inicializar necesitamos un ciclo completo de datos, es decir los s
primeros valores.
1
Ls (Y1 Y2 ... Ys )
s
1 Y Y Y Y
Y Yk
bs s 1 1 s 2 2 ... s k
k
s
s
s
.
Si hay suficientes datos k = s, es decir dos ciclos completos.
Sin embargo podemos tomar k = 1.
Los ndices estacionales se inicializan
Sk
Yk
Ls
k 1, 2, ..., s
Lt (Yt St s ) (1 )( Lt 1 bt 1 )
bt ( Lt Lt 1 ) (1 )bt 1
St (Yt Lt ) (1 ) St s
Ft m Lt bt m St s m
S k Yk Ls
k 1, 2, ..., s .
10
11
Mtodos de descomposicin
EJEMPLO: Los datos siguientes corresponden al nmero de muertos en accidentes
mensualmente en U.S.A. de 1973 a 1978 (fuente National Sadety Council)
1973
1974
1975
1976
1977
1978
Enero
9007
7750
8162
7717
7792
7836
Febrero
8106
6981
7306
7461
6957
6892
Marzo
8928
8038
8124
7776
7726
7791
Abril
9137
8422
7870
7925
8106
8129
Mayo
10017
8714
9387
8634
8890
9115
Junio
10826
9512
9556
8945
9299
9434
Julio
11317
10120
10093
10078
10625
10484
Agosto
10744
9823
9620
9179
9302
9827
Septiembre
9713
8743
8285
8037
8314
9110
Octubre
9938
9129
8433
8488
8850
9070
Noviembre
9161
8710
8160
7874
8265
8633
Diciembre
8927
8680
8034
8647
8796
9240
serie
9800
8800
7800
6800
0
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
20
40
60
80
media mensual
8044.0
7283.83
8063.83
8264.83
9126.17
9595.33
10452.8
9749.17
8700.33
8984.67
8467.17
8720.67
12
serie
9800
8800
7800
6800
0
12
15
Season
Ordinate
3
2
1
0
0
0.1
0.2
0.3
0.4
0.5
0.6
frequency
Procedimiento para tendencias pequeas
Medias anuales
Ao
1973
1974
1975
Media
9651.75
8718.5
8585.83
1976
8396.75
1977
8576.83
1978
8796.7
5
media_anual
9500
9200
8900
8600
8300
0
20
40
60
80
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
1973
-644.75
-1545.75
-723.75
-514.75
365.25
1174.25
1665.25
1092.25
61.25
286.25
-490.75
-724.75
1974
-968.5
-1737.5
-680.5
-296.5
-4.5
793.5
1401.5
1104.5
24.5
410.5
-8.5
-38.5
1975
-423.83
-1279.83
-461.83
-715.83
801.17
970.17
1507.17
1034.17
-300.83
-152.83
-425.83
-551.83
1976
-679.75
-935.75
-620.75
-471.75
237.25
548.25
1681.25
782.25
-359.75
91.25
-522.75
250.25
1977
-784.83
-1619.83
-850.83
-470.83
313.17
722.17
2048.17
725.17
-262.83
273.17
-311.83
219.17
1978
-960.75
-1904.75
-1005.75
-667.75
318.25
637.25
1687.25
1030.25
313.25
273.25
-163.75
443.25
serie_mediaanual
2
1
0
-1
-2
0
20
40
60
80
Sj (componente estacional)
-743.735
-1503.9
-723.902
-522.902
338.432
807.598
1665.1
961.432
-87.4017
196.932
-320.568
-67.0683
14
Componente estacional
3000
2400
1800
1200
600
0
-600
-1200
-1800
-2400
1
10
11
12
1978
-217.015
-400.85
-281.848
-144.848
-20.182
-170.348
22.15
68.818
400.6517
76.318
156.818
510.3183
residuos
800
400
0
-400
-800
0
20
40
60
80
Procedimiento general
15
1 1
1
X t 6 X t 5 ... X t X t 1 ... X t 5 X t 6
12 2
2
1973
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
9599.38
9500.13
9416.17
9349.29
9265.21
9156.17
1974
9051.54
8963.29
8884.5
8810.38
8757.88
8728.79
8735.67
8766.38
8783.5
8764.08
8769.13
8799.0
1975
8799.71
8790.13
8762.58
8714.5
8662.58
8612.75
8567.29
8555.21
8547.17
8534.96
8505.88
8449.04
1976
8422.96
8403.96
8375.25
8367.21
8357.58
8371.21
8399.88
8382.0
8358.92
8364.38
8382.58
8408.0
1977
8445.54
8473.46
8490.13
8516.75
8548.13
8570.63
8578.67
8577.79
8577.79
8581.46
8591.79
8606.79
1978
8606.54
8622.54
8677.58
8719.92
8744.42
8778.25
12
24
36
48
60
72
20
40
60
1976
-705.958
80
1977
-653.542
1978
-770.542
16
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
1717.625
1243.875
296.833
588.708
-104.208
-229.167
-1982.292
-846.5
-388.375
-43.875
783.208
1384.333
1056.625
-40.5
364.917
-59.125
-119
-1484.125
-638.583
-844.5
724.417
943.25
1525.708
1064.792
-262.167
-101.958
-345.875
-415.042
-942.958
-599.25
-442.208
276.417
573.792
1678.125
797
-321.917
123.625
-508.583
239
-1516.458
-764.125
-410.75
341.875
728.375
2046.333
724.208
-263.792
268.542
-326.792
189.208
-1730.542
-886.583
-590.917
370.583
655.75
20
40
60
80
Medias mensuales
-813.858
-1531.28
-747.008
-535.35
333.883
736.875
1670.42
977.3
-118.308
248.767
-268.917
-67.0
Sj (componente estacional)
-804.304033
-1521.726033
-737.454033
-525.796033
343.436967
746.428967
1679.973967
986.853967
-108.754033
258.320967
-259.363033
-57.446033
17
componente estacional
3600
3000
2400
1800
1200
600
0
-600
-1200
-1800
-2400
1
10
11
12
Serie desestacionalizada Xt - St :
serie desestacionalizada
11800
10800
9800
8800
7800
6800
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
20
1973
9811.304
9627.726
9665.454
9662.796
9673.563
10079.57
9637.026
9757.146
9821.754
9679.679
9420.363
8984.446
1974
8554.304
8502.726
8775.454
8947.796
8370.563
8765.571
8440.026
8836.146
8851.754
8870.679
8969.363
8737.446
40
1975
8966.304
8827.726
8861.454
8395.796
9043.563
8809.571
8413.026
8633.146
8393.754
8174.679
8419.363
8091.446
60
1976
8521.304
8982.726
8513.454
8450.796
8290.563
8198.571
8398.026
8192.146
8145.754
8229.679
8133.363
8704.446
80
1977
8596.304
8478.726
8463.454
8631.796
8546.563
8552.571
8945.026
8315.146
8422.754
8591.679
8524.363
8853.446
1978
8640.304
8413.726
8528.454
8654.796
8771.563
8687.571
8804.026
8840.146
9218.754
8811.679
8892.363
9297.446
18
Mtodos de suavizado
Suavizado exponencial simple
.- Suprime las fluctuaciones a corto plazo y suaviza la serie.
.- Media ponderada de los valores previos con major peso para las observaciones
recientes.
.-No hay tendencia ni estacionalidad
Ft 1 (1 ) F1 (1 ) j Yt j
t
j 0
Lt Yt (1 )( Lt 1 bt 1 )
bt ( Lt Lt 1 ) (1 )bt 1
Ft m Lt bt m
Lt es un estimador de la media y bt estima la tendencia lineal de la serie en el instante t, y
Ft+m es la prediccin.
Las ecuaciones se inicializan
L1 = Y1 and b1 = 0.Sin embargo inicializar la pendiente a 0 puede dar problemas y
en ocasiones hay que tomar cuidadosamente un estimador inicial.
19
Mtodo de Holt-Winter
Es una extensin del mtodo anterior que tiene en cuenta la estacionalidad
.- Introduce tendencia y estacionalidad
F(t) = (L(t) + b(t))*S(t-12)
F(t+m) = (L(t) + m*b(t))*S(t-12+m)
Mtodo multiplicativo
Con ecuaciones
Lt
Yt
(1 )( Lt 1 bt 1 )
St s
bt ( Lt Lt 1 ) (1 )bt 1
St
Yt
(1 ) St s
Lt
Ft m Lt bt m St s m
Siendo s la estacionalidad o nmero de estaciones en un ciclo.
Para inicializar necesitamos un ciclo completo de datos, es decir los s
primeros valores.
1
Ls (Y1 Y2 ... Ys )
s
1 Y Y Y Y
Y Yk
bs s 1 1 s 2 2 ... s k
k
s
s
s
.
Si hay suficientes datos k = s, es decir dos ciclos completos.
Sin embargo podemos tomar k = 1.
Los ndices estacionales se inicializan
Sk
Yk
Ls
k 1, 2, ..., s
Lt (Yt St s ) (1 )( Lt 1 bt 1 )
bt ( Lt Lt 1 ) (1 )bt 1
St (Yt Lt ) (1 ) St s
Ft m Lt bt m St s m
S k Yk Ls
k 1, 2, ..., s .
20
Modelos de Box-Jenkins
Una caracterstica esencial de las series temporales es la dependencia que existe
entre las observaciones.
A comienzo de los aos 70, G.E.P. Box, profesor de Estadstica de la Universidad de
Wisconsin, y G.M. Jenkins, profesor de Ingeniera de Sistemas de la Universidad de
Lancaster, introdujeron una pequea revolucin en el enfoque del anlisis de series
temporales, en sus trabajos sobre el comportamiento de la contaminacin en la baha de San
Francisco, con el propsito de establecer mejores mecanismos de pronstico y control. El
libro (1976) en el que describen la metodologa, se convirti rpidamente en un clsico, y
sus procedimientos se utilizan ampliamente desde entonces en diferentes ramas de la
ciencia, conocindose como modelos ARIMA y tambin como modelos Box-Jenkins.
La metodologa de Box-Jenkins modela esta dependencia utilizando la teora
probabilstica suministrada por los procesos estocsticos estacionarios y la metodologa
estadstica suministrada por la teora de la estimacin y contraste de hiptesis.
Un proceso estocstico es una coleccin de variables indexadas por el tiempo
X (t ) tT
A1... An
en trminos de distribucin.
P X (t1 ) A1... X (tn ) An P X (t1 h) A1... X (tn h) An .
Las distribucines finito-dimensionales slo dependen de la posicin relativa de las
coordenadas entre s y no del instante del tiempo en que esten tomadas
En particular,
Todas las distribuciones unidimensionales son iguales, es decir, todas las
variables aleatorias X(t) estn igualmente distribuidas.
Para las distribuciones bidimensionales se verifica:
d
21
a1 , a 2 ,...a n T
a K (t
i 1 j 1
t j )a j 0
( X t ) 1 ( X t 1 ) 2 ( X t 2 ) ... p ( X t p ) Z t
( B )( X t ) ( B ) Z t .
s
En forma abreviada ( X t ) ( B ) Z t
Se pueden combinar los anteriores modelos para dar lugar a
Las raices de (Bs) fuera del crculo unidad
23
Identificacin
Cmo identificamos el modelo?
Para identificar el modelo nos basamos ademas de la grfica de los datos frente al
tiempo, de las grficas de la funcin de autocorrelacin y funcin de autocorrelacin parcial
muestrales..
Estas grficas se comparan con las grficas de las correspondientes funciones
tericas que tiene una forma caracterstica para cada modelo.
Denotamos por
ACF la funcin de autocorrelacin. Esta funcin est definida en el retardo k como
(k) = Cov(xt, xt+h)/var(xt)
Mide la relacin lineal entre estas variables.
PACF la funcin de autocorrelacin parcial. En el retardo k mide la relacin lineal
entre Xt y Xt+k pero quitando la dependencia entre las variables intermedias.
En general
Modelos AR(p)
ACF decrece exponencialmente hacia o mediante ondas seno-coseno con
amplitudes decreciendo exponencialmente.
PACF se anula a partir del retardo p
Modelos MA(q)
ACF se anula a partir del retardo q
PACF decrece exponencialmente hacia o mediante ondas seno-coseno con
amplitudes decreciendo exponencialmente.
Modelos ARMA(p,q)
p<q
ACF decrece exponencialmente hacia o mediante ondas seno-coseno con
amplitudes decreciendo exponencialmente; como en el modelo AR(p) pero a
partir del retardo q-p+1, es decir que los primeros q-p+1 retardos no tienen
pauta fija.
PACF decrece exponencialmente hacia o mediante ondas seno-coseno con
amplitudes decreciendo exponencialmente, es decir como el modelo MA(q)
p>q
24
ACF
PACF
25
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.0
0.0
-0.2
-0.2
-0.4
-0.4
-0.6
-0.6
-0.8
-1.0
-0.8
0
12
18
24
30
-1.0
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.0
12
18
24
30
-0.2
-0.4
-0.4
-0.6
-0.6
-0.8
-0.8
0
12
18
24
30
-1.0
1.0
1.0
0.8
0.8
0.6
0.6
0.4
12
18
24
30
0.4
0.2
0.2
0.0
0.0
-0.2
-0.2
-0.4
-0.4
-0.6
-0.6
-0.8
-1.0
0.0
-0.2
-1.0
-0.8
0
ACF
12
18
24
30
-1.0
12
18
24
PACF
26
30
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.0
0.0
-0.2
-0.2
-0.4
-0.4
-0.6
-0.6
-0.8
-0.8
-1.0
12
18
24
-1.0
30
18
24
30
0.6
0.6
0.4
0.4
0.2
0.2
0.0
0.0
-0.2
-0.2
-0.4
-0.4
-0.6
-0.6
-0.8
-0.8
0
12
18
24
30
-1.0
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.0
0.0
-0.2
-0.2
-0.4
-0.4
-0.6
-0.6
-0.8
-0.8
0
12
18
24
30
-1.0
12
12
12
18
18
24
30
24
30
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.0
0.0
-0.2
-0.2
-0.4
-0.4
-0.6
-0.6
-0.8
-0.8
-1.0
12
0.8
0.8
-1.0
1.0
1.0
-1.0
-1.0
ACF
12
18
24
30
18
24
30
PACF
27
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.0
0.0
-0.2
-0.2
-0.4
-0.4
-0.6
-0.6
-0.8
-1.0
-0.8
0
12
18
24
30
-1.0
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.0
0.0
-0.2
-0.2
-0.4
-0.4
-0.6
-0.6
-0.8
-0.8
-1.0
12
18
24
30
-1.0
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.0
0.0
-0.2
-0.2
-0.4
-0.4
-0.6
-0.6
-0.8
-0.8
-1.0
12
18
24
30
-1.0
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.0
0.0
-0.2
-0.2
12
18
24
30
12
18
24
30
12
18
24
30
-0.4
-0.4
-0.6
-0.6
-0.8
-0.8
-1.0
-1.0
ACF
12
18
24
30
12
18
24
30
PACF
28
(0,1)(0,1)
(0,1)(1,1)
(0,1)(0,1)
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.0
0.0
-0.2
-0.2
-0.4
-0.4
-0.6
-0.6
-0.8
-0.8
-1.0
12
24
36
48
60
-1.0
12
24
36
48
60
(0,2)(0,1)
29
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.0
0.0
-0.2
-0.2
-0.4
-0.4
-0.6
-0.6
-0.8
-0.8
-1.0
12
24
36
48
-1.0
60
12
24
36
48
60
(0,0)(1,0)
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.0
0.0
-0.2
-0.2
-0.4
-0.4
-0.6
-0.6
-0.8
-0.8
-1.0
12
24
36
48
60
-1.0
12
24
36
48
12
24
36
48
60
(0,0)(1,1)
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.0
0.0
-0.2
-0.4
-0.2
-0.6
-0.4
-0.8
-0.6
-1.0
12
24
36
48
60
-1.0
(2,0)(1,0)
0.5
0.4
0.3
0.2
0.1
0
-0.1
-0.2
-0.3
-0.4
-0.5
0
-0.8
12
24
36
48
60
60
0.5
0.4
0.3
0.2
0.1
0
-0.1
-0.2
-0.3
-0.4
-0.5
0
12
24
36
48
60
(o,1)(1,0)
30
Estimacin:
Una vez identificado el modelo, se estiman los parmetros con los mtodos
habituales.
validacin
Hay que verificar las hiptesis del modelo.
.- Todos los parmetros son significativos.
.-Los residuos estn incorrelados.
Se calcula para ello el estadstico de Ljung-Box:
Q1 = [N(N+2)]/(N-k) k r2a(h)
h=1
Bajo la hiptesis nula de que el modelo est bien ajustado, se distribuye
segn una chi cuadrado con grados de libertad k-p-q
(r1, r2, ..., rk) las correlaciones correspondientes a los k primeros retardos.
.- El modelo es estacionario.
Ejemplo
Serie Nmero de Parados registrados en Castilla y Len. El periodo estudiado comprende
datos desde enero de 1980 hasta mayo de 2001
Representacin grfica de la serie
paro total Castilla y Len
200000
180000
160000
140000
120000
100000
80000
60000
40000
20000
0
A la vista del grfico vemos que nuestra serie no es estacionaria, presenta una clara
tendencia que sigue los ciclos de la economa, tambin muestra componentes estacionales.
Este hecho tambin se pone de manifiesto en las grficas de las funciones de
autocorrelacin, autocorrelacin parcial y periodograma de la serie.
En la funcin de autocorrelacin observamos que hay un decrecimiento muy lento,
muy lejano del decrecimiento exponencial de los modelos estacionarios.
31
Autocorrelaciones
1
0.6
0.2
-0.2
-0.6
-1
0
10
20
30
40
50
lag
Autocorrelaciones Parciales
10
20
30
40
50
0.4
0.5
lag
0.1
0.2
0.3
frecuencia
32
As nos encontramos con una serie estacional. Si nos fijamos en los retardos
estacionales (12, 24, 36, 48) el decrecimiento de la correlacin puede o no puede ser
exponencial, necesitamos ms grficas para saber si la serie es estacionaria.
La funcin de autocorrelacin parcial no muestra falta de estacionariedad, ni el
retardo 1 ni el primer retardo estacional son demasiado grandes frente a los dems.
La grfica del periodograma muestra un pico muy pronunciado en la frecuencia 0.08
indicativo de estacionalidad de periodo 12 y otros picos menos pronunciados en los
armnicos siendo el siguiente en orden de magnitud el correspondiente a la frecuencia 0.25,
es decir periodo 4 indicativo de cierta periodicidad trimestral.
Tambin observamos un pico de menor magnitud en una frecuencia prxima a cero
indicativo de una variacin a largo plazo que todava persiste en la serie y que la aleja de la
estacionariedad.
La diferencia de orden 1 no ha sido suficiente para quitar la tendencia.
Autocorrelacin para el paro en Castilla y Len diferenciada de orden 1
Autocorrelaciones
1
0.6
0.2
-0.2
-0.6
-1
0
10
20
30
40
50
lag
Autocorrelaciones Parciales
10
20
30
40
50
lag
0.1
0.2
0.3
0.4
0.5
frecuencia
Aplicamos una diferencia estacional a la serie para comprobar si esta operacin hace
a la serie estacionaria y analizamos nuevamente los grficos.
33
Autocorrelaciones
1
0.6
0.2
-0.2
-0.6
-1
0
10
20
30
40
50
lag
Autocorrelaciones Parciales
12
18
24
30
36
42
48
lag
0.1
0.2
0.3
0.4
0.5
frecuencia
Por tanto procedemos a aplicar una diferencia regular y una diferencia estacional a
la serie original. Las tres grficas siguientes no muestran falta de estacionariedad, as
modelaremos esta serie.
Observamos en la funcin de autocorrelacin que los primeros retardos decrecen
exponencialmente, indicativo de un polinomio autorregresivo de orden 1 y slo hay un
retardo estacional que podamos considerar distinto de 0, indicativo de un polinomio de
media mvil estacional de orden 1.
34
Autocorrelaciones
1
0.6
0.2
-0.2
-0.6
-1
0
10
20
30
40
50
lag
Autocorrelaciones Parciales
10
20
30
40
50
lag
Periodograma Paro Castilla y Len diferenciada de orden 1 y 12
(X 1.E7)
8
6
4
2
0
0
0.1
0.2
0.3
0.4
0.5
frecuencia
35
AR2,1
-0.28994
0.06283
-4.61 12
Variance Estimate = 2727641.33
Std Error Estimate = 1651.55725
AIC
= 4311.52136
SBC
= 4318.5157
Number of Residuals=
244
Correlations of the Estimates
Parameter
AR1,1
AR2,1
AR1,1
1.000
-0.049
AR2,1
-0.049
1.000
Model for variable CYL
No mean term in this model.
Period(s) of Differencing = 1,12.
Autoregressive Factors
Factor 1: 1 - 0.43581 B**(1)
Factor 2: 1 + 0.28994 B**(12)
ARIMA Procedure
Name of variable = RESIDUAL.
Mean of working series = -69.8716
Standard deviation
= 1648.301
Number of observations =
244
Autocorrelations
Lag Square DF Prob
6 12.13 6 0.059 -0.029 -0.006 0.114 0.141 -0.121 0.000
12 16.81 12 0.157 0.017 0.076 -0.068 -0.011 0.065 -0.057
18 19.06 18 0.388 -0.054 0.060 0.018 -0.042 -0.007 -0.001
24 33.17 24 0.101 -0.042 -0.045 -0.033 -0.020 0.008 -0.215
30 34.19 30 0.273 -0.012 -0.023 0.018 0.041 0.025 0.019
36 41.43 36 0.246 0.018 -0.046 0.007 0.037 -0.083 -0.120
En forma ms expandida.
Para el incremento mensual
(Xt -Xt-1)=(Xt-12-Xt-13)+0.42(Xt-1-Xt-2)-0.3(Xt-12-Xt-13)-0.55(Xt-13-Xt-14)+
0.3(Xt-24-Xt-25)-0.13(Xt-25-Xt-26)+Zt
Para el incremento anual
(Xt -Xt-12)=(Xt-1-Xt-13)+0.42(Xt-1-Xt-13)-0.42(Xt-2-Xt-14)-0.3(Xt-12-Xt-24)+
0.17(Xt-13-Xt-25)+0.13(Xt-14-Xt-26)+Zt
As vemos que el incremento del nmero de parados en un mes determinado
depende positivamente
-Del incremento del nmero de parados en el mes anterior (0.42)
-Del incremento del nmero de parados del mismo mes del ao anterior (0.7)
- Del incremento del nmero de parados del mismo mes de dos aos anteriores
(0.3)
Depende negativamente
-Del incremento del paro un mes anterior del ao anterior (0.55)
-Del incremento del paro un mes anterior de dos aos antes (0.13)
El incremento anual del nmero de varones parados crece
-Con el incremento anual del mes anterior (1.42)
-Con el incremento anual del mes anterior del ao anterior (0.17)
-Con el incremento anual de dos meses anteriores del ao anterior.(0.17)
36
Decrece
-Con el incremento anual de dos meses anteriores (0.42)
-Con el incremento anual del ao anterior (0.3)
Paro total en la comunidad
/*Lectura de Datos: */
libname d 'c:\juntas\salidas';
data d.datos;
infile 'c:\juntas\ paro registrado total\paro registrado.txt' dlm='09'x;
input Av Bu CyL Le Pa Sa Se So Va Za;
date= intnx('month','31dec79'd,_n_);
format date monyy.;
run;
/*******************************/
/*Identificacin de las series:*/
/*******************************/
/*Serie de la provincia de vila: */
title1 'Paro registrado en vila';
title2 '( Enero 1980 - Mayo 2001 )';
/*modelo SARIMA(0,1,1)(1,1,1)12 */
PROC ARIMA data= d.datos;
IDENTIFY var=Av(1,12) nlag=36 ;
ESTIMATE q=(1)(12) noconstant
method=ml
plot outcorr
outest=resul.test
outstat=resul.stat
outmodel=resul.model;
FORECAST out=b id=date interval=month noprint;
run;
PROC ARIMA data=b;
IDENTIFY var=residual nlag=36;
run;
37
It*(t) = 1
Efectos transitorios
f(It*) = w0 It* w0 = 1
1,2
1
0,8
0,6
0,4
0,2
0
11
13
Efectos permanentes
Gradual f(It*) = (w0/1- It* w0=1
13
11
Efectos transitorios
f(It*) = (w0/1- It*
38
0,5
1,5
0,4
0,3
13
11
13
11
0
1
0,1
0,2
0,5
Funcin de transferencia
Los modelos vistos hasta ahora son modelos univariantes. Se modela la serie como
un filtro, es decir como una combinacin lineal de valores pasados y presentes.
Ahora veremos un modelo que relaciona una serie con sus valores pasados y
presentes y con los valores pasados y presentes de otra serie.
Sean Xt e Yt dos series temporales estacionarias.
Xt representa el input o variable causa
Yt el output o variable respuesta.
Nt es un ruido incorrelado con la serie input Xt que ser modelado como
ARMA.
El modelo final se expresa
Yt = vj Xt-j + Nt
El operador V(B) = vj Bj se llama funcin de transferencia
Los pesos vi son los pesos impulso-respuesta del sistema.
Si los parmetros v0 = v1 = . . . = vb-1, entonces las variaciones en el input se
manifiestan en el output b retardos despus.
En la formulacin del modelo, se supone que el presente y el pasado del input
influyen en el presente del output, pero no al revs, es decir, no existe retroalimentacin o
feed-back.
La correlacin entre Yt y Xt+k es 0. Los valores futuros de X no dependen de
los valores pasados y presentes de Y.
39
en el input producen cambios finitos en el output. Esto asegura la estacionalidad del output.
V(1) = vj = g < .
A g se le denomina ganancia del sistema y representa el valor del output si el input
es constante e igual a 1 y no hay perturbacin.
El modelo presenta un problema y es que tiene infinitos parmetros, una
alternativa sera truncar el polinomio V(B), es decir, Yt = v0 Xt + v1 Xt-1 + ... + vh Xt-h + Nt.
Donde h se elige de forma que el efecto de los retardos posteriores a h sea
despreciable, sin embargo es una decisin difcil y puede evitarse poniendo V(B) como
cociente de dos polinomios.
V(B)= W(B) Bb/ (B)
W(B) = w0 + w1B + ... + ws Bs
(B) = 1- 1B - 2 B2 - ... - r Br
De esta forma se reduce el nmero de parmetros y el modelo es
Yt = [W(B) Bb/ (B)] Xt + Nt
Si no existe perturbacin, es decir Nt = 0 el modelo sera
( 1 - 1B - 2 B2 - ... - r Br) Yt = (w0 + w1B + ... + ws Bs)Bb Xt
Expresin anloga a la de un modelo ARMA(r, s). Es decir un modelo ARMA es un
caso particular de un modelo dinmico de funcin de transferencia en el que el input es un
ruido blanco, no existe perturbacin y la funcin de transferencia es el cociente de dos
polinomios correspondientes a la parte de media mvil el numerador y a la parte
autorregresiva el denominador. As las condiciones de estacionaridad e invertibilidad para
la funcin de transferencia son las mismas que para los modelos ARMA, es decir, las races
de los polinomios W(B) y (B) fuera del crculo unidad.
Identificacin
40
j = b+1, ...b+s
j> b + s
Estas relaciones hay que tenerlas presentes ya que son muy tiles para identificar la
funcin de transferencia, lo que es equivalente a identificar
b, retardo a partir del cual una variacin en el input se refleja en el output
s, orden del polinomio del numerador.
r, orden del polinomio del denominador.
En las ecuaciones que verifican los coeficientes se observa
- los b-1 primeros coeficientes son 0 v0 = v1 = ... = vb-1 = 0
- los siguientes s+1 no siguen ninguna pauta fija vb vb+1 ... vb+s
- a partir del coeficiente s+b+1 los vk verifican una ecuacin en diferencias
anloga a la que verifica la funcin de autocorrelacin de un modelo AR(r), es decir
decrecimiento suma de exponenciales y ondas seno coseno.
Para identificar la funcin de transferencia es importante una estimacin inicial de
los pesos vj. Para ello necesitaremos la funcin de autocorrelacin cruzada ya que como
veremos los vk son proporcionales a ella. Antes daremos algunas definiciones.
Definicin:
Un proceso estocstico bivariante (Xt, Yt) se dice que es estacionario en el sentido
amplio si
Cada componente Xt Yt es estacionario. La funcin de autocovarianza solo depende
del retardo que separa las variables y no del tiempo en que se mide.
KX(h) = cov(Xt, Xt+h)
h = 0 , 1, 2, . . .
La funcin de covarianza cruzada entre las dos series solo depende del retardo que
las separa.
41
t=1
En general las varianzas y covarianzas de estos estimadores son difciles de calcular. En
algunos casos especiales disponemos de aproximaciones.
- Si Xt es ruido blanco e Yt y Xt son incorreladas la aproximacin de Barlett (1955)
da como resultado
Var [rX,Y (h)] (N-h)-1
Corr [rX,Y (h), rX,Y (h+1)] Y(1).
Es decir, aunque los procesos sean incorrelados, los estimadores de la funcin de
correlacin cruzada estn correlados y reproducen la autocorrelacin del output en
el primer retardo.
- Si Xt e Yt son los dos ruido blanco y estn incorrelados entonces
Var [rX,Y (h)] (N-h)-1
Corr [rX,Y (h), rX,Y (h+1)] 0.
Por analoga con los modelos ARMA, se puede intentar identificar la funcin de
transferencia a partir de las correlaciones cruzadas muestrales, pero las propiedades
muestrales no son fciles de establecer, al estar estos estimadores correlados. Los clculos
se simplificaran sobremanera si el input fuera un ruido blanco, ya que en este caso
disponemos de la aproximacin de Barlett. Por lo que vamos a utilizar la tcnica de
preblanqueo para conseguirlo.
Tcnica de preblanqueo:
42
V (B)
W b
N t Yt - V (B)X t Yt W b
Nt
N (B) N t = N(B)at
Estimacin
Los mtodos de estimacin son los mismos que en las series univariantes.
Si W(B) y (B) son polinomios de orden 0, se obtienen estimadores mnimo
cuadrados con expresin exacta, en caso contrario los estimadores se obtienen por
aproximaciones sucesivas.
Debemos estimar los coeficientes de los polinomios (B) W(B) N(B) N(B).
Sea el parmetro a estimar = ( , W , N, N).
Para cualquier eleccin de b se pueden calcular los errores at a partir de t > m
siendo m = max ( p+r, b+p+s ) + 1 mediante la expresin
(B) N Yt = W(B) N (B) Xt-b + (B) N(B) at que en forma desarrollada
at = Yt - d1 Yt-1 - . . . -dp+r Yt-r-p - c0 Xt-b - c1 Xt-b-1 -... - cp+sXt-b-p-s - b1 at-1 -... - bq+r a t-q-r
nos permite calcular la suma de los cuadrados de los residuos.
Si suponemos a0 = a1 = . . . = am = 0 obtenemos mnimos cuadrados condicionados.
44
Validacin
Es la etapa siguiente a la estimacin. El modelo ajustado puede no ser vlido por
.- El modelo para el ruido Nt no es el adecuado.
En este caso los residuos son correlados y a(h) 0 para algn h > 0,
Pero como la funcin de transferencia est bien ajustada, el input
preblanqueado y los residuos estn incorrelados, es decir, ,a (h) = 0 h.
En este supuesto hay que buscar un nuevo modelo para el ruido, sin
modificar la funcin de transferencia.
.- El modelo para la funcin de transferencia no es el adecuado.
El input preblanqueado y los residuos estn correlados, es decir
,a (h) 0 para algn h. En este caso hay que modificar la funcin de
transferencia lo que llevar consigo tambin una modificacin del modelo
para el ruido o perturbacin.
.- Ninguno de los dos modelos es adecuado.
Este caso se comporta como el anterior.
A continuacin vamos a probar estas afirmaciones.
Supongamos el modelo
Yt = -1(B)W(B) Xt-b + N-1 (B) N(B) at = V(B) Xt + (B) at
y que hemos seleccionado el modelo
Yt = V0(B) Xt + 0(B) a0t
Despejando
aot = 0-1(B) [Yt - V0(B)Xt] = 0-1(B) [V(B) - V0(B)]Xt + 0-1(B) (B) at.
Si la funcin de transferencia es correcta
aot = 0-1(B) (B) at.
{a0t} no es un ruido blanco, presenta autocorrelacin a0(h) 0 para algn h
Pero {a0t} y {t}son incorrelados ya que {t} y {at} lo son.
45
t = X(B) -1X(B) Xt
46
Q1 = [N(N+2)]/(N-k) k r2a(h)
h=1
r a(h) es la autocorrelacin en el retardo h de los residuos
2
Q2 = [N(N+2)]/(N-k) k r2 ,a(h)
h=1
r , a(h) correlacin cruzada en el retardo h del input preblanqueado y los residuos
Bajo la hiptesis nula de que el modelo est bien ajustado, estos estadsticos se
distribuyen segn una chi cuadrado con grados de libertad k-p-q y k-r-s respectivamente.
Siendo p y q los ordenes autorregresivo y de media mvil de la perturbacin y r y s
los ordenes del numerador y denominador de la funcin de transferencia.
Necesitamos los dos estadsticos para asegurarnos de la bondad del modelo. Estos
dos estadsticos son muy conservadores, por lo que adems es conveniente estudiar la
aleatoriedad de los residuos at por los mtodos habituales.
2
Prediccin
Las tcnicas utilizadas para la prediccin son las mismas que en el caso univariante.
Partiendo del modelo ajustado
Yt = -1(B)W(B) BbXt + N-1 (B) N(B) at .
Dejando libre el error obtenemos
N (B) N-1(B)Yt = N(B) N-1(B) -1(B)W(B)Bb Xt + at.
Desarrollando ambos miembros
N (B) N-1(B) = 1-1B-2B2 - . . .
N(B) N-1(B) -1(B)W(B)Bb = v0* + v1*B + v2*B2 + ...
De donde
Yt = (1Yt-1 + 2Yt-2 + ... ) + (v0*Xt + v1*Xt-1 + v2*Xt-2 + ... ) + at.
Ecuacin que puede ser usada para obtener la prediccin de Y N+s como combinacin
lineal de valores pasados de Xt e Yt hasta el instante N, de forma que el error cuadrtico
medio sea mnimo.
En caso de normalidad YN(s) = E(YN+s/ YN, YN-1,... XN, XN-1 ,...).
Tambin puede ponerse la prediccin como combinacin lineal de los errores y del
input preblanqueado, ya que por ser estas series ruido blanco e incorreladas entre s, nos
facilitar el clculo de la varianza del error de prediccin.
47
Errores de prediccin
Partiendo de la misma ecuacin Yt = -1(B)W(B) BbXt + N-1 (B) N(B) at
como Xt = X-1 (B) X(B) t llegamos a la ecuacin
Yt = -1(B)W(B) Bb X-1 (B) X(B) t + N-1 (B) N(B) at = u(B) t + (B) at
Con u(B) = -1(B)W(B) Bb X-1 (B) X(B)
(B) = N-1 (B) N(B)
Que desarrollada da lugar a
YN+s = u0 N+s + u1 N+s-1 + . . . + us N + . . . + aN+s + 1aN+s-1 + . . . + saN + . . .
Si expresamos la prediccin de la forma
YN(s) = (0(1) aN + 1(1) aN-1 + . . . ) + (0(2) N + 1(2) N-1 + . . . )
Elegiremos los i(j) de forma que el error cuadrtico E(|YN+s - YN(s)|2 )sea mnimo.
E(|YN+s - YN(s)|2 ) =
E{( u0 N+s + u1 N+s-1 + . . . + us-1 N+l + aN+s + 1aN+s-1 + . . . + s-1aN )+
[(us-0(2))N + (us-1-1(2))N-1 + . . . ] +[(s-0(1))aN + (s-1-1(1))aN-1 + . . . ]}2
El mnimo de esta funcin se alcanza para
0(2)= us ,
El valor de la prediccin es
YN(s) = (us N + us+1 N-1 + . . . ) + ( saN + s+1aN-1 + . . .)
Con error de prediccin
eN(s) = u0 N+s + u1 N+s-1 + . . . + us-1 N+l + aN+s + 1aN+s-1 + . . . + s-1aN+1
y varianza del error de prediccin
V(eN(s)) = ( u02 + u12 + . . . + us-12 ) + (1 + 12+ . . . + s-12 ) 2a
48
50
60000
50000
40000
30000
20000
10000
51
52
53
modelo ajustado
112 .84
(1 B )(1 B 12 ) X t (1 0.39 B )(1 0.33B 12 ) Z t
(1 0.89 B )
54
Aparte de este efecto, la serie del paro femenino sigue evolucionando segn un
modelo estacional SARIMA(1,1,0)(1,1,0)12.
Un incremento en el IPC produce ese mismo mes un descenso en el paro femenino
Modelos multivariantes
Modelos ARIMA
Se definen igual que en el caso univariante, solo que los coeficientes en lugar de ser
nmeros sern matrices.
AR(p)
X t 1 X t 1 2 X t 2 ... p X t p Z t
MA(q)
X t 1 Z t 1 2 Z t 2 ... pq Z t q Z t
Con
Xt =(X1,t; X2,t;Xk,t)
1,2, p, 1 ,2,q matrices kxk
Zt =(Z1,t; Z2,t;Zk,t) vector ruido verificando
E(Zt, Zs) = 0
E(Zt, Zt) =
Las componentes de Zt son procesos de ruido blanco univariantes, incorrelados con
los dems en distintos tiempos, pero posiblemente correlados en el mismo tiempo, es decir
no es una matriz diagonal.
55
Para que exista una solucin estacionaria del modelo es necesario que las raices de |
(z)| esten fuera del crculo unidad. Para que el modelo sea identificable, es necesario que
las raices de | (z)| esten fuera del crculo unidad.
Siendo
(z) = u=0, k u Zu
(z) = u=0, k u Zu
Para ajustar estos modelos usamos la sentencia SAS proc statespace que utiliza el
modelo de espacio de estados que es una representacin mediante un proceso de markov de
las series multivariantes.
Ejemplo
libname d 'c:\datos';
title1 'Castilla y Leon';
data d.cyl;
infile "datos\cyl.txt" dlm='09'x firstobs=2;
input Paro Hombres Mujeres Sinempleo Cregistrados Cindefinidos Colocaciones
Demandas men25 de20a24 de25a29 de30a34 mayo25 meno20 de35a39 de40a44 de45a49
de50a54 de55a59 mayo59 EmpresaE empCyL TI3M ILP ipc12 ipc13 ipc14 ipc15 ipc16
ipc17 ipc18 ipc19 ipc20 ;
date= intnx('month','31dec79'd,_n_);
format date monyy.;
/*proc print; */
run;
proc statespace data=d.cyl out= cylfuera lead=12;
var Mujeres(1,12) Sinempleo(1,12) Colocaciones (1,12) ILP(1);
id date;
form Mujeres 4 Sinempleo 1 Colocaciones 1 ILP 1;
restrict F(2,1)=0 F(2,4)=0 F(3,2)=0 F(3,5)=0 F(4,1)=0 F(4,2)=0 F(4,3)=0
F(4,5)=0F(7,1)=0 F(7,3)=0 F(7,4)=0 F(7,7)=0 G(5,3)=0 G(6,1)=0G(6,2)=0 G(6,3)=0
56
57
Standard
Variable
Mean
Error
__CastillayLeon 9.273182 4.311289
Espana
9.740455 3.402027
The STATESPACE Procedure
Selected Statespace Form and Preliminary Estimates
State Vector
__CastillayLeon(T;T)
Espana(T;T)
Maximum likelihood estimation has converged.
Estimate of Transition Matrix
-0.34349
1.103079
-0.1863
0.820067
Input Matrix for Innovation
1
0
0
1
Variance Matrix for Innovation
12.04467
7.44271
7.44271
7.069811
Parameter Estimates
Parameter
Estimate
Standard
Error
t Value
58
F(1,1)
F(1,2)
F(2,1)
F(2,2)
-0.34349
1.103079
-0.18630
0.820067
0.347871
0.440728
0.266635
0.337817
-0.99
2.50
-0.70
2.43
To
Lag
6
oscilaciones, que las series originales. Tambin como a partir del ao 1990 las serie de
Castilla y Len siempre est por debajo de la serie de Espaa , signo de el menor
crecimiento econmico de nuestra comunidad que el crecimiento medio a nivel nacional.
vila
60
61
11.73739
7.56436
4.860158
7.56436
7.226412
4.662947
4.860158
4.662947
13.1272
Parameter Estimates
Standard
Parameter Estimate Error
F(1,2)
0.861068 0.231554
F(1,3)
-0.20253 0.121041
F(2,2)
0.590153 0.162895
F(3,1)
0.597553 0.173264
t Value
3.72
-1.67
3.62
3.45
Covariance
-0.716465
0.289003
-0.109605
-1.408363
0.652823
0.730121
2.208398
0.446340
0.720759
-0.585625
7.121899
0.478219
-1.650747
1.439995
1.188948
1.264630
0.487752
-0.863886
-0.523020
1.406699
-2.336863
Crosscorrelations
Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1
-.08272 |
.
**|
.
|
0.03337 |
.
|*
.
|
-.01265 |
.
|
.
|
-.16260 |
.
***|
.
|
0.07537 |
.
|**
.
0.08429 |
.
|**
.
0.25496 |
.
|***** .
0.05153 |
.
|*
.
0.08321 |
.
|**
.
-.06761 |
.
*|
.
0.82222 |
.
|****************
0.05521 |
.
|*
.
-.19058 |
****|
.
0.16625 |
.
|*** .
0.13726 |
.
|*** .
0.14600 |
.
|*** .
0.05631 |
.
|*
.
-.09974 |
.
**|
.
-.06038 |
.
*|
.
0.16240 |
.
|*** .
-.26979 |
. *****|
.
62
To
Lag
6
ChiPr >
Square DF ChiSq --------------------Autocorrelations-------------------2.69
6 0.8469 0.025 -0.094 0.162 0.112 0.186 0.090
Correlation of RES2 and RES3
Variance of input =
12.35423
Number of Observations
22
Lag
-10
-9
-8
-7
-6
-5
-4
-3
-2
-1
0
1
2
3
4
5
6
7
8
9
10
Covariance
-1.910090
2.688432
-1.149504
-0.982808
2.439418
2.245745
0.739302
3.344567
-0.552505
-0.351285
4.279745
-1.179240
-0.398727
-0.669390
-0.103661
-0.699936
1.902586
-2.075009
-1.963786
1.031299
-1.227639
Crosscorrelations
Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1
-.20945 |
.
****|
.
0.29480 |
.
|****** .
-.12605 |
.
***|
.
-.10777 |
.
**|
.
0.26750 |
.
|***** .
0.24626 |
.
|***** .
0.08107 |
.
|**
.
0.36675 |
.
|***** .
-.06059 |
.
*|
.
-.03852 |
.
*|
.
0.46930 |
.
|*********
-.12931 |
.
***|
.
-.04372 |
.
*|
.
-.07340 |
.
*|
.
-.01137 |
.
|
.
-.07675 |
.
**|
.
0.20863 |
.
|**** .
-.22754 |
.
*****|
.
-.21534 |
.
****|
.
0.11309 |
.
|**
.
-.13462 |
.
***|
.
Covariance
-1.386896
1.517526
-2.501320
-1.231276
2.706255
-0.680085
0.924432
-1.899108
Crosscorrelations
Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1
-.11819 |
.
**|
.
0.12932 |
.
|*** .
-.21316 |
.
****|
.
-.10493 |
.
**|
.
0.23063 |
.
|**** .
-.05796 |
.
*|
.
0.07878 |
.
|**
.
-.16184 |
.
***|
.
63
-2
-1
0
1
2
3
4
5
6
7
8
9
10
-0.308584
-1.877841
4.537718
-1.464646
-0.455613
1.814367
2.437544
2.631974
4.851007
-0.902383
-1.425162
2.286682
-2.848317
-.02630
-.16003
0.38671
-.12482
-.03883
0.15462
0.20773
0.22430
0.41341
-.07690
-.12145
0.19487
-.24274
|
|
|
|
|
|
|
|
|
|
|
|
|
.
.
.
.
.
.
.
.
.
.
.
.
.
*|
.
***|
.
|********.
**|
.
*|
.
|*** .
|**** .
|**** .
|**** .
**|
.
**|
.
|**** .
*****|
.
64
..+
..-
10
0
0
0
0
1
0
65
1
0
0
0
1
0
0
0
1
0
0
-0.03337
0
0
-0.73448
0
0
0.03502
0
0.432555
-0.05713
Variance Matrix for Innovation
719538.2
45385.57
195740.9
45385.57
452139.4
-80561.8
195740.9
-80561.8
5148956
Parameter Estimates
Standard
Parameter Estimate
Error t Value
F(5,1)
-0.10656 0.090399
-1.18
G(4,3)
-0.03337 0.026871
-1.24
G(5,3)
-0.73448 0.048492
-15.15
G(6,3)
0.035020 0.026945
1.30
G(7,2)
0.432555 0.090523
4.78
G(7,3)
-0.05713 0.026905
-2.12
66
Donde:
sigma es la varianza condicional
Siendo t-1 la historia pasada del proceso t
Los alpha son los parmetros especificados por el modelo
Epsiln son la innovaciones
(t )2= tet
No hay que olvidar que los modelos Garch son para las innovaciones o errores, en la
prctica, se ajustan modelos ARIMA con residuos heterocedsticos, con o sin tendencia.La
sentencia SAS que se utiliza es proa autoreg
68
data d.cyl1;
set d.cyl;
diferencia=importaciones-exportaciones;
retardo=lag1(diferencia);
run;
proc autoreg data=d.cyl1 corrb covb outest= d.fuera covout;
model diferencia=retardo/lagdep nlag=1 dwprob archtest;
output out =d.b R=residuos RM=residuosestructurales P=prediccion
PM=prediccionestructural LCL=lcl UCL=ucl LCLM=lclestructural
UCLM=uclestructural;
run;
data h;
set d.fuera;
proc print;
run;
data g;
set d.b;
cuadrado = residuos*residuos;
/* proc print;*/
run;
proc arima data =g;
identify var=residuos;
identify var=cuadrado;
identify var= residuosestructurales;
run;
proc gplot data =d.b;
plot diferencia*date prediccion*date lcl*date ucl*date/overlay;
symbol1 i=joint v=none;symbol2 i=joint v=none;symbol3 i=joint v=none;symbol4
i=joint v=none;
run;
plot residuos*date;
symbol1 i=joint v=none;
run;
plot diferencia*date prediccionestructural*date lclestructural*date
uclestructural*date/overlay;
symbol1 i=joint v=none;symbol2 i=joint v=none;symbol3 i=joint v=none;symbol4
i=joint v=none;
run;
plot residuosestructurales*date;
symbol1 i=joint v=none;
run;
plot diferencia*date prediccionestructural*date /overlay;
symbol1 i=joint v=none;symbol2 i=joint v=none;
run;
plot diferencia*date lclestructural*date uclestructural*date/overlay;
symbol1 i=joint v=none;symbol2 i=joint v=none;symbol3 i=joint v=none;
69
run;
plot lclestructural*date uclestructural*date/overlay;
symbol1 i=joint v=none;symbol2 i=joint v=none;
run;
Con resultados
Variable Dependiente diferencia
Estimadores
SSE
3,10189E11
DFE
MSE
1704336109
Root MSE
SBC
4441,77354
AIC
Regress R-Square
0,0321
Total R-Square
Durbin's t
-1,9467
Pr < t
182
41284
4435,34367
0,0321
0,0266
Retardo
-34,39605
0,005466
DF
1
1
1
DFE
181
Root MSE
40957
AIC
4433,50855
Total R-Square
0,0526
Standard
Estimador
Error
2763
2392
0,4725
0,1007
0,3119
0,1055
Approx
t Value
1,15
4,69
2,96
Pr > |t|
0,2496
<,0001
0,0035
AR1
-49,60026
0,0078809
0,0111281
Pr > |t|
0,2404
<,0001
_SSE_
_STDERR_
303621862785
,
303621862785 2391,82
303621862785
0,10
303621862785
0,11
_MSE_
1677468855,2
1677468855,2
1677468855,2
1677468855,2
_A_1
0,3119
-49,6003
0,0079
0,0111
Chi-
Lag
Square
Pr >
DF
ChiSq
--------------------Autocorrelations--------------------
23,70
0,0006
-0,312
0,025
0,147
-0,056
0,053
0,025
12
29,33
12
0,0035
-0,043
0,081
-0,070
0,056
0,105
-0,035
18
36,14
18
0,0068
0,082
-0,036
0,044
-0,027
0,100
-0,112
24
44,37
24
0,0069
0,146
-0,062
0,054
-0,038
-0,018
0,097
Los residuos estructurales estn correlados por lo que no sobra el haber ajustado
un modelo estructural, la ecuacin de medida no produce residuos incorrelados.
72
Variable
Media
Desv. Est.
Observaciones
residuos
27,73732
40621,65
184
Chi-
Pr >
Lag
Square
DF
ChiSq --------------------Autocorrelations--------------------
6,31
0,3898
-0,028
-0,030
0,168
-0,003
0,050
0,031
12
12,04
12
0,4424
-0,013
0,056
-0,037
0,080
0,132
0,023
18
15,14
18
0,6522
0,076
0,000
0,030
0,017
0,075
-0,052
24
19,89
24
0,7032
0,119
-0,005
0,023
-0,032
-0,003
0,084
cuadrado
1.6501E9
5.6603E9
184
Chi-
Lag
Square
Pr >
DF
ChiSq
--------------------Autocorrelations-------------------6
1.18
0.9778
0.033
0.062
0.015
0.014
-0.025
0.016
12
2.24
12
0.9989
-0.013
-0.038
0.002
0.055
0.003
-0.027
18
7.09
18
0.9893
0.074
0.052
0.027
0.069
0.093
-0.039
24
9.53
24
0.9962
0.074
0.067
-0.025
-0.027
-0.020
0.007
Ecuacin de medida
et = 0.31 et-1 + Zt
Ecuacin estructural
73
estn dentro de los lmites de confianza de una serie aleatoria. Sigue habiendo residuos muy
altos negativos en los mismos datos que en el modelo anterior.
74
Variable acerinox:
Analysis Summary
Data variable: ACERINOX
Number of observations = 248
Start index = 02/01/98
Sampling interval = 1,0 day(s)
75
ACERINOX
2,5
2
1,5
1
0,5
0
29/11/97
18/01/98
09/03/98
28/04/98
17/06/98
06/08/98
25/09/98
1
0,6
0,2
-0,2
-0,6
-1
0
10
15
20
25
lag
Partial Autocorrelations
10
15
20
25
lag
P-value = 0,13638
Box-Pierce Test
Test based on first 24 autocorrelations
Large sample test statistic = 4,30292
P-value = 0,999997
Time Series Plot for adjusted ACERINOX
adjusted ACERINOX
(X 1000)
3
-1
-5
-9
-13
-17
29/11/97
18/01/98
09/03/98
28/04/98
17/06/98
06/08/98
25/09/98
1
0,6
0,2
-0,2
-0,6
-1
0
10
15
20
25
lag
Partial Autocorrelations
10
15
20
25
lag
77
(X 1,E7)
58
38
18
-2
-22
-42
29/11/97
18/01/98
09/03/98
28/04/98
17/06/98
06/08/98
25/09/98
1
0,6
0,2
-0,2
-0,6
-1
0
10
15
20
25
lag
Name of Variable = ACERINOX
Mean of Working Series 13155.56
Standard Deviation
10052
Number of Observations
248
Autocorrelation Check for White Noise
To
Lag
ChiSquare
6
1420.03
12
2706.40
18
3853.16
24
4850.47
Pr >
DF
ChiSq
--------------------Autocorrelations----------------
6 <.0001
0.990 0.980 0.970
0.961
0.952
0.943
12 <.0001 0.932 0.923 0.914
0.904
0.893
0.883
18 <.0001 0.873 0.863 0.852
0.841
0.830
0.819
24 <.0001 0.808 0.796 0.785
0.773
0.762
0.751
Name of Variable = ACERINOX
Period(s) of Differencing
1
Mean of Working Series
-78.9676
Standard Deviation
1099.983
Number of Observations
247
Observation(s) eliminated by differencing
1
78
ChiSquare
0.78
2.68
3.85
4.54
Pr >
DF
ChiSq
--------------------Autocorrelations----------------
ChiSquare
61.10
65.17
70.74
73.92
Pr >
DF
ChiSq --------------------Autocorrelations---------------6 <.0001
0.494 -0.023 -0.013 -0.002 -0.009 -0.027
12 <.0001 -0.075 -0.029 0.051
0.045 -0.019 -0.067
18 <.0001 -0.027 0.059 0.102
0.069
0.026
0.032
24 <.0001 0.042 -0.003 -0.057 -0.059 -0.002
0.056
libname d 'c:\datos';
title1 'ibex98';
data d.ibex98;
infile "datos\ibex98.txt" dlm='09'x firstobs=2;
input ene fecha $ ACESA ACERINOX AGUAS_BARNA CORP_FIN_ALBA AMPER
ARGENTARIA AUMAR BK_BILBAO_VIZC BK_C_HISPANO BANKINTER BANESTO CANTABRICO
CONTINENTE GAS_NATURAL DRAGADOS_Y_CONST ENDESA E_N_CELULOSA
FOMENTO_DE_CONST FECSA GESA IBERDROLA MAPFRE METROVACE BK_POPULAR PRYCA
REPSOL BK_SANTANDER SEVILLANA_ELEC TABACALERA TELEFONICA_ESP U_FENOSA
URALITA VALLEHERMOSO VISCOFAN IBEX;
proc print;
run;
proc arima data =d.ibex98;
identify var = ACERINOX ; identify var = ACERINOX(1);run;
data b;
set d.ibex98;
acerinoxc = acerinox*acerinox;
run; proc print; run;
proc arima data = b;
identify var=acerinoxc(2);run;
proc autoreg data = d.ibex98 /*outest= a covout=c */ archtest /*out=
fuera*/;
model acerinox(1)= ene corrb covb lagdep hetero cev = varcond cpev=
varpred garch(q=1,p=1);run;
Bibliografa
.- Bollerslev, T. Engle, r. y Nelson, D(1994): ARCH Models.. Robert Engle y D. McFadden editores.
Handbook of Econometrics, Vol IV. Elservier, Amsterdam.
79
80