Intervalos de Prediccion
Intervalos de Prediccion
Intervalos de Prediccion
Ejercicio 2
Intervalos de Prediccion
Pablo Fuentes - Mario Vergara
EL7012 Control Inteligente de Sistemas
14 de Noviembre de 2015
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
1.
Introducci
on
Para la operacion optima de las micro-redes es importante contar con modelos de prediccion confiables de variables tales como: potencia solar, potencia eolica, consumo y estado
de carga de las bateras. Los modelos de prediccion son importantes debido a la incertidumbre asociada a la generacion con energa renovable y la variabilidad del consumo local. El
intervalo de prediccion se compone de los lmites superior e inferior donde se espera que una
futura observacion se encuentre, con un determinado nivel de confianza.
De esta manera los tipos de modelos a utilizar y las metodologas que subyacen para
calcular sus intervalos de prediccion son de vital importancia, que dependiendo del tipo
de problema, algunos enfoques seran mas adecuados que otros. En este caso, los modelos
de interes son los lineales, difusos y neuronales. Los modelos lineales act
uan como primera
aproximacion al problema, ya que son faciles de generar al igual que su intervalo de confianza,
aportando claridad en su estructura y la determinacion de los regresores mas relevantes del
problema. En segundo lugar se encuentran los modelo difusos, en especfico los T&S, los cuales
mediante un set de reglas y consecuencias lineales puede caracterizar procesos altamente no
lineales, siendo muy utilizados tambien en prediccion. Por u
ltimo los modelos neuronales
ocupados en prediccion si bien son cajas negras en cuanto a su estructura, son altamente
utilizados en este ambito debido a su capacidad de generalizar procesos altamente no lineales.
En esta ocasion se construyen estos tipos de modelos aplicados en la caracterizacion futura
del consumo de energa, en donde ventajas y desventajas son analizadas para cada modelo.
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
2.
Marco Te
orico
2.1.
Definici
on de sistemas lineales
Nr
X
i xi
(1)
i=1
(2)
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
p
X
!
ai z
1z
1 d
Yt =
1+
q
X
!
ci z
et
(3)
i=1
i=1
Estimaci
on param
etrica para modelos lineales
d
Si se tiene una serie de tiempo {d}N
i=1 , un sistema lineal y =
costo cuadratico:
PNr
i=1 i xi
y un funcional de
d
1X
J=
(
y (t) di )2
2 i=1
en donde y =
PNr
i=1 i xi ,
(4)
1
XT Y
(5)
donde:
..
..
...
X=
.
.
x1 (Nd ) . . . xNr (nd )
Y = y(1) . . . y(Nd )
(6)
(7)
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
2.1.2.
Determinaci
on de intervalos de confianza para sistemas lineales
La construccion y entrenamiento de un sistema lineal puede considerarse como la aproximacion de la media del proceso. Cuando se realiza prediccion, no solamente es importante
estimar la media futura, sino tambien estimar los intervalos de confianza de prediccion del
proceso para tener una idea de lo confiable que resulta la estimacion futura. Sea una base
de datos de la forma {[x(1) , y (1) , [x(2) , y (2) ], . . . , [x(N ) , y (N ) ]} con la cual se entrena el modelo
lineal dado por
y (x, ), entonces el intervalo de confianza de prediccion para un instante x0
esta dado por [2]:
s
y (x, ) t0.025[N 2]
1
(x0 x)2
+ PN
+1
nx
2
N
(x
)
n=1
!
(8)
2.2.
Definici
on de intervalos de confianza difusos
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
Donde Ari es el set de regiones difusas para la variable i de la regla r, gir es el parametro
de consecuencia para la regla r e yr es la salida para la regla r. La salida global del sistema
queda dada por la siguiente expresion:
PNr
y(k) = Pr=1
Nr
wr yr
r=1 wr
(9)
(10)
Nr
X
i rr
(11)
r=1
donde:
i r = r (Xi ) [1 xi1 xi2 . . . xin ] ; r = [0r 1r 2r . . . nr ]
(12)
En este caso la salida esta definida a partir de una combinacion lineal de las consecuencias r
de cada regla r y el set de variables con n + 1 elementos en su base tal y como se muestra en
la Ecuacion (12). El modelo Takagi-Sugeno entregado en la Ecuacion (11) puede ser usado
para aproximar cualquier funcion que vaya de un conjunto cerrado de reales de dimension d
arbitraria a un espacio real unidimensional con un alto grado de precision.
El proceso de identificacion de sistemas es una tarea bastante iterativa y necesita de por
lo menos de los siguientes tres puntos:
Identificar las variables base que se van a utilizar para identificar el comportamiento
de la planta, estas pueden ser tanto retrasos de la entrada como de la salida o alguna
combinacion de estas.
Identificacion de las zonas donde se presenta un comportamiento particular del sistema
y modelar dicha zona de manera difusa, caracterizandolas con una funcion de pertenencia definida. Con estas zonas es posible dise
nar un set de reglas que permiten discernir
la salida local del modelo.
Calcular para cada regla, los parametros que caracterizaran el modelo local. Regularmente este proceso se denomina como identificacion de las consecuencias.
5
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
2.2.2.
Identificaci
on de los intervalos de confianza del modelo Takagi-Sugeno
Se asume un set de mediciones dadas por la entradas X = [x(t)1 x(t)2 . . . x(t)N ] y salidas
Y = [y(t) y(t + 1) . . . y(t + N )]. Se dira que el sistema satisface la ecuacion no lineal dada
por:
y(t + i) = g(xi ) i = 1, . . . , N
(13)
Acorde al teorema de Stone-Weierstrass, para cualquier funcion continua g, existe una
sistema difuso f y un > 0 que cumple con la Ecuacion (14). Esta da a conocer la aproximacion del sistema difuso a cualquier funcion continua, siempre y cuando se considere un
valor de acorde al problema. En este caso este valor de entregara la banda de confianza
del proceso de estimacion del sistema.
maxxi X |g(xi ) f (xi )| < i
(14)
Nr
X
r (xi )r
(15)
r=1
(16)
El analisis de la varianza del modelo Takagi-Sugeno se realizara usando los modelos locales
que lo definen. Es por ello que en cada regla existira un valor de r2 que dependera del set de
datos de entrada. En este punto se necesita conocer ei , el cual muestra el comportamiento
del error generado del modelo con la salida real del sistema en cada instante i de medicion y
el error medio generado por las salidas locales del modelo er . Seg
un [4], un buen estimador
de cada varianza local esta dada por:
PN 2
(ei er )2
2
; r = 1, . . . , Nr
(17)
r = i=1PirN 2
ir
i=1
donde e queda definido por:
PN
er = Pi=1
N
ir ei
i=1 ir
; r = 1, . . . , Nr
(18)
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
(19)
Para construir dichas funciones, se realiza un ajuste en las salidas locales dadas por cada
una de las reglas que definen al modelo Takagi-Sugeno con tal de reproducir los intervalos
superior e inferior deseados en la Ecuacion (19). Seg
un [4], los intervalos inferior y superior
para cada uno de las salidas locales dado una entrada Xi esta dada por:
1+
f (Xi )r = ir r t,M n
T
ir
1
r Tr
ir
1/2
1 1/2
T
f (Xi )r = ir r + t,M n
1 + ir
r Tr
ir
(20)
(21)
yupper =
Nr
X
f (Xi )r
(23)
r=1
2.3.
Definici
on de redes neuronales
Las redes neuronales son un conjunto de funciones no lineales que poseen una arquitectura
inspirada en las interconexiones de las redes neuronales a nivel biologico. Una neurona , es
la unidad fundamental que puede ser descrita de la siguiente manera:
y=f
N
X
!
W i Xi + b
(24)
i=1
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
deben ponderar por los diferentes pesos Wij sumar las respectivas contribuciones y aplicar
la funcion no lineal correspondiente. El mismo proceso ocurre en la capa oculta en donde se
reciben las se
nales uj para luego obtener las se
nales zk de la capa de salida. Por lo general
en la capa de salida solo act
ua como un ponderador lineal de las entradas, de esta manera,
una red neuronal con una capa de entrada, oculta y salida puede ser descrita como:
zk =
N2
X
Vjk fj
j=1
N1
X
!
Wij xi + bj
(25)
i=1
2.3.1.
Si se designa una red neuronal como una funcion no lineal y = g(x, ) donde x es el
vector de entrada y el vector de todos los parametros y la base de datos de entrenamiento
como el vector d. Cuando el enfoque es entrenar una red neuronal para realizar prediccion,
necesariamente el vector de entrada x se transforma en regresores de la salida y, por lo que
x = [y(t 1), y(t 2), . . . , y(t r)] y se puede encontrar los pesos minimizando un funcional
de costo cuadratico:
N
d
2
1X
J=
g(xl , ) y l
2 l=1
(26)
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
(27)
d
X
dg(xl , t )
dJ
g(xl , t ) y l
=
dVjk
dVjk
l=1
Nd
X
l
g(xl , t ) y fj
N1
X
(28)
!
Wij xli + bj
(29)
i=1
l=1
d
l
X
dJ
l
l dg(x , t )
=
g(x , t ) y
dWij
dWij
l=1
Nd
X
l=1
Nd
X
l=1
(30)
dfj (uj ) duj
g(xl , t ) y l Vjk
duj dWij
(31)
dfj (uj ) l
x
g(xl , t ) y l Vjk
duj i
(32)
Una vez que se tiene el vector de parametros optimo , luego para realizar prediccion,
de g(x(t), ) solo basta introducir la condicion inicial correspondiente x(t0 ) = x0 y luego
retroalimentar las salidas de una iteracion como las entradas de la siguiente.
2.3.2.
Intervalos de predicci
on para redes neuronales
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
d
2 2
1X
y2
J=
y y l
2 l=1
(34)
d
2 2
1X
g2 (xl , 2 ) g1 (xl , 1 ) y l
2 l=1
y z0.025
(35)
(36)
d
1X
J=
2 l=1
d
1X
=
2 l=1
y y l
y2
!2
2
+ ln
y2
g1 (xl , ) y l
g2 (xl , )
(37)
!2
2
+ ln g2 (xl , )
(38)
y t0.025[v] Var(
2
10
(39)
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
donde t0.025[v] es el punto del soporte de una distribucion t-student con v grados de libertad
y ) es la varianza emprica de la salida de la red
donde al area bajo la curva es 0.025, Var(
2
que aproxima la media, y
es la varianza estimada del ruido.
2.4.
Medidas de desempe
no para cuantificar calidad de las predicciones
Para poder analizar la calidad de los modelos y poder contrastar las predicciones adecuadamente con la data de validacion respectiva, existen diversas medidas de desempe
no para
ello. Algunas de las medidas como RMSE, MAPE y MAE apuntan a comparar la prediccion
del modelo versus la data de validacion, y existen otras medidas como PICP, NMPIW y
CWC para evaluar la calidad de los intervalos de confianza [3]. A continuacion se enuncia las
medidas que se aplican en el analisis:
2.4.1.
Se define como:
v
u n
u1 X
RMSE = t
(yi yi )2
n i=1
(40)
Se define como:
n
1 X yi yi
MAPE =
n i=1 yi
(41)
Se define como:
n
1X
MAE =
|yi yi |
n i=1
(42)
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
2.4.4.
Se define como:
n
1X
ci
PICP =
n i=1
(43)
1, ti [Li , Ui ]
0, ti
/ [Li , Ui ]
(44)
Se define como:
n
1 X
(Ui Li )
NMPIW =
R n i=1
(45)
Se define como:
CWC = NMPIW 1 + e(PICP)
(46)
donde :
=
1, PICP
0, PICP <
(47)
Esta medida es un criterio hbrido que recoge los otros dos criterios anteriores ponderados.
En donde los valores de y son seteados como 0.5 y 0.9.
12
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
3.
3.1.
Desarrollo
Preprocesamiento de datos y construcci
on de Modelos lineales
En primer lugar la base de datos a utilizar corresponde a dos series de tiempo correspondiente al consumo en potencia que se mide cada 15[min]. El primer set de datos es de
entrenamiento y tiene un largo de 14112 datos, mientras que el segundo set de datos tiene
un largo de 4500. En este caso el primer set se ocupa para poder entrenar los diferentes
modelos, y con el segundo se comprueba el desempe
no en terminos de la prediccion. Como
se especifica en el primer paso de la metodologa de Box Jenkins, se calculan las se
nales de
autocorrelacion y autocorrelacion parcial. Como se ve en la Figura 2 como es de esperarse, el
consumo es periodico en el tiempo, mostrando peaks en ACF y PACF de correlaciones cada
96 iteraciones, es decir, el consumo tiene una periodicidad diaria.
Sample Autocorrelation Function
Sample Autocorrelation
0.5
0.5
20
40
60
80
100
Lag
120
140
160
180
200
160
180
200
0.5
0.5
20
40
60
80
100
Lag
120
140
Figura 2: ACF y PACF del set de datos de entrenamiento para 209 retardos.
Siguiendo la metodologa, se debe convertir el consumo a una se
nal estacionaria, para
eso se diferencia en repetidas ocasiones encontrandose que con solo una diferenciacion es
suficiente para hacer que los coeficientes de ACF y PACF decaigan exponencialmente como
se aprecia en la Figura 3.
13
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
Sample Autocorrelation
0.5
0.5
20
40
60
80
100
Lag
120
140
160
180
200
160
180
200
0.5
0.5
20
40
60
80
100
Lag
120
140
Figura 3: ACF y PACF del set de datos de entrenamiento diferenciados una vez para 209
retardos.
En este caso se considera que tanto ACF y PACF decaen similarmente, pero mostrando
relevancia en el componente 96, por lo cual se construye un modelo con 96 autoregresores
y una diferenciacion. Asimismo, se considera realizando diferentes pruebas, se encuentra
que la cantidad de regresores adecuados para el ruido es de 48. De esta manera el modelo
generado es un ARIMA con los siguientes parametros: d = 1 ( por la diferenciacion de la se
nal
original), p = 96 por las correlaciones de los autoregresores y jugando con los valores de q, se
encuentra que q = 48 es adecuado para que et sea lo mas cercano a ruido blanco gaussiano. El
supuesto anterior se valida con la Figura 4, en donde los residuos estan centrados en cero, la
autocorrelacion y la autocorrelacion parcial indican que los residuos estan descorrelacionados
y el grafico de Sample Data versus Standard Normal refleja una curva mayoritariamente
lineal en contraste con la roja punteada.
De esta manera como se aprecia en la Figura 5 se genera una prediccion de la forma
y(i + t|t) con i = 1 : 196 (dos das) y sus respectivos intervalos de confianza del 95 %
comparado con los datos de validacion. En terminos cualitativos, la se
nal de prediccion logra
caracterizar adecuadamente la data de validacion, la cual no escapa del intervalo de confianza.
Este resultado en particular indica que el modelo lineal si bien no logra predecir en gran
14
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
Standardized Residuals
15
10
5
0
5
10
5000
10000
10
5
0
5
10
4
15000
Sample Autocorrelation
0.5
10
Lag
15
0.5
2
0
2
Standard Normal Quantiles
0.5
0.5
20
10
Lag
15
20
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
18
Prediccin
Data validacin
Intervalos de confianza de 95%
16
14
12
10
20
40
60
80
100
120
Tiempo [15[m]]
140
160
180
200
Figura 5: Modelo Lineal: Comparacion entre prediccion Y (i + t|t) para i = 1, . . . , 192 con
intervalos de confianza del 95 % y data de validacion para los primeros 192 datos.
predicciones de 1 y 4 pasos debido a que la prediccion es acorde a los datos de validacion,
y estos a su vez estan dentro de los intervalos de prediccion estimados por el modelo. A
diferencia de los casos anteriores, no se obtiene lo mismo para la prediccion a 96 y 192
pasos en donde la prediccion con sus intervalos de confianza no calzan en todo el intervalo
con la data de prediccion. Esto u
ltimo puede deberse a la incertidumbre acumulada que
significa hacer una prediccion a largo plazo. De todas maneras en la seccion de comparacion
y discusiones se analizan los resultados cuantitativamente en tablas con distintas medidas de
desempe
no.
16
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
20
25
Prediccin
Data validacin
Intervalos de confianza de 95%
18
Prediccin
Data validacin
Intervalos de confianza de 95%
20
16
14
12
10
15
10
5
6
4
0
2
10
20
30
40
50
60
Tiempo [15[m]]
70
80
90
100
10
20
30
40
50
60
Tiempo [15[m]]
70
80
90
100
(a) Predicci
on a un paso y(1 + t|t) para t = 1 : 96 (b) Prediccion a 4 pasos y(4 + t|t) para t = 1 : 96
de datos de validaci
on.
de datos de validacion.
22
25
Prediccin
Data validacin
Intervalos de confianza de 95%
20
Prediccin
Data validacin
Intervalos de confianza de 95%
18
20
16
14
12
10
15
10
10
20
30
40
50
60
Tiempo [15[m]]
70
80
90
100
10
20
30
40
50
60
Tiempo [15[m]]
70
80
90
100
(c) Predicci
on a 96 pasos y(96 + t|t) para t = 1 : (d) Prediccion a 192 pasos y(192 + t|t) para t =
96 de datos de validaci
on.
1 : 96 de datos de validacion.
Figura 6: Modelo Lineal: Comparacion entre prediccion Y (i0 + t|t), i0 = {1, 4, 96, 192}, t =
1 : 96 e intervalos de confianza del 95 % con datos de validacion.
17
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
3.2.
Modelos difusos
La estructura del modelo difuso cumple con diferentes etapas de optimizacion, con tal
de satisfacer de mejor manera el comportamiento general del sistema. Se da inicio con la
separacion de los datos para el proceso de entrenamiento, prueba y validacion. Para ello se
escoge una base que contiene las se
nales de salida del sistema hasta con 5 retardos. Este
valor fue escogido como cota maxima, dado que la iteracion con mas cantidad de retardos
se vuelve muy costoso para el procesamiento computacional, volviendolo casi inmanejable
para el procesador y memoria fsica disponible para el alumno. No se realiza un analisis de
sensibilidad de las variables del modelo dado a la reducida cantidad de retardos, los cuales
consideran el comportamiento del sistema dentro de 1 hora y 15 minutos.
Con los datos de entrenamiento se generan las premisas y consecuencias del modelo para
cada una de las reglas. Se hace un estudio de la cantidad optima de cl
uster usando los datos de
prueba. En este caso se tiene que tres cl
uster son mas que suficiente para describir de buena
manera el comportamiento de la planta, dado que es justo el punto rodilla de la Figura 7.
Dada esta configuracion se tienen 243 reglas diferentes. Cada una de ellas con sus respectivas
premisas generadas a partir del set de entrenamiento, utilizando tecnicas de cl
uster difuso y
ajustando funciones Gaussianas a cada una de ellas.
Figura 7: Desempe
no del modelo con distintos n
umero de cl
uster, utilizando los datos de
prueba
Los parametros de las consecuencias se calculan con la se
nal de salida real del sistema y
18
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
las variables de entrada del modelo. Se asume linealidad con las bases escogidas, lo cual hace
un poco mas sencillo la estimacion de dichos parametros.
Luego de calcular los elementos fundamentales del modelo, se procede a calcular los
intervalos de confianza usando los datos de validacion generados por el sistema real. Para
ello se necesita la informacion de los pesos normalizados de cada una de las reglas, denominado
como r , con los cuales es posible calcular la desviacion estandar de cada una de las reglas
generadas en el modelo. Se asume 90 % de confianza para la distribucion tstudent con 2435
grados de libertad dado por la totalidad de parametros del sistema, dando t5,1215 = 1.2822.
Con la desviaciones estandar de cada regla y t5,1215 , se procede a generar las matrices del
modelo, usando los pesos normalizados y las entradas dadas por el conjunto de validacion.
Con todo esto es posible generar las funciones locales que dan a conocer el intervalo superior
e inferior seg
un lo visto en la Seccion 2.2.
En este caso, la salida estimada del primer metodo de estimacion, donde se deja fijo el
tiempo y se varia el tiempo de estimacion i, converge a un valor constante pasado los 500
minutos de simulacion. Se observa que la se
nal sigue el promedio de la se
nal de validacion
dentro de los 500 minutos, pero despues le es imposible subir a los peak de alto consumo de
potencia, tal y como se observa en la Figura 8.
Figura 8: Modelo Difuso: Comparacion entre prediccion Y (i + t|t) para i = 1, . . . , 192 con
intervalos de confianza del 90 % y data de validacion para los primeros 215 datos.
La Figura 9 entrega el resultado de prediccion a 1, 4, 96 y 192 pasos. Los graficos contienen
19
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
la se
nal de salida del conjunto de validacion, la prediccion del modelo Takagi-Sugeno y los
intervalos de confianza del modelo. En este caso se puede observar que tanto estimaciones de
1 y 4 pasos siguen el la se
nal de salida del conjunto de validacion. Ademas se puede observar
que los intervalos de confianza contienen gran parte de los datos de validacion, cumpliendo
con su rol de dise
no. Sin embargo, en la prediccion a 96 y 192 pasos la se
nal estimada del
modelo es constante. Si bien el proceso de estimacion es el mismo para todos los casos, una
ventana de prediccion mayor a la entregada por 3 horas (12 pasos) hara que la se
nal de
salida estimada tienda a un valor fijo constante. Esto puede ser debido a la condicion inicial
entregada para el proceso de estimacion, el cual empieza en una zona de bajada. Mientras
no se reciba una se
nal con alg
un peak de subida como entrada, el modelo no entregara una
se
nal de salida creciente, si no mas bien mantendra su valor a la cota mnima de potencia
entregada en los datos de validacion.
20
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
(a) Predicci
on a un paso y(1 + t|t) para t = 1 : 96 (b) Prediccion a 4 pasos y(4 + t|t) para t = 1 : 96
de datos de validaci
on.
de datos de validacion.
(c) Predicci
on a 96 pasos y(96 + t|t) para t = 1 : (d) Prediccion a 192 pasos y(192 + t|t) para t =
96 de datos de validaci
on.
1 : 96 de datos de validacion.
Figura 9: Modelo Difuso: Comparacion entre prediccion Y (i0 + t|t), i0 = {1, 4, 96, 192},
t = 1 : 96 e intervalos de confianza del 90 % con datos de validacion usando modelo TakagiSugeno.
21
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
3.3.
Modelos neuronales
y2 (w, x) que aproxima la varianza de la estimacion, por lo que en este caso el funcional de
costo es el de la ecuacion (35), donde se minimiza el error cuadratico medio de la varianza
del proceso. Con la segunda red entrenada se procede a construir el intervalo de prediccion
de acuerdo a la ecuacion (33). De esta manera como se ve en la Figura 10 se construye la
prediccion Y (i + t|t) en donde i = 1 : 192 representando al prediccion de dos das, para un t
que demarca el inicio de los datos de validacion.
La Figura 10 solo devela el comportamiento de la prediccion para un t fijo, sin embargo el
verdadero objetivo es calcular predicciones a diferentes pasos en cada iteracion del proceso,
es decir, si se desea realizar una prediccion a i0 pasos, entonces se debe obtener la curva
y(i0 + t|t) para un conjunto de t. En este caso se calcula para t = 1 : 96 (un da), las
predicciones i0 = {1, 4, 96, 192} hacia adelante correspondiendo a 15 minutos, una hora, un
da y dos das en el futuro respectivamente. Los resultados se pueden apreciar en la Figura 11.
22
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
20
Prediccin
Data validacin
Intervalos de confianza de 95%
18
16
14
12
10
20
40
60
80
100
Tiempo [15[m]]
120
140
160
180
Figura 10: Modelo Neuronal: Comparacion entre prediccion Y (i + t|t) para i = 1, . . . , 192 con
intervalos de confianza del 95 % y data de validacion para los primeros 192 datos.
23
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
22
22
Prediccin
Data validacin
Intervalos de confianza de 95%
20
Prediccin
Data validacin
Intervalos de confianza de 95%
20
18
18
16
14
12
10
16
14
12
10
8
8
10
20
30
40
50
60
Tiempo [15[m]]
70
80
90
100
10
20
30
40
50
60
Tiempo [15[m]]
70
80
90
100
(a) Predicci
on a un paso y(1 + t|t) para t = 1 : 96 (b) Prediccion a 4 pasos y(4 + t|t) para t = 1 : 96
de datos de validaci
on.
de datos de validacion.
22
30
Prediccin
Data validacin
Intervalos de confianza de 95%
20
Prediccin
Data validacin
Intervalos de confianza de 95%
25
16
18
14
12
20
15
10
10
10
20
30
40
50
60
Tiempo [15[m]]
70
80
90
100
10
20
30
40
50
60
Tiempo [15[m]]
70
80
90
100
(c) Predicci
on a 96 pasos y(96 + t|t) para t = 1 : (d) Prediccion a 192 pasos y(192 + t|t) para t =
96 de datos de validaci
on.
1 : 96 de datos de validacion.
Figura 11: Modelo Neuronal: Comparacion entre prediccion Y (i0 + t|t), i0 = {1, 4, 96, 192},
t = 1 : 96 e intervalos de confianza del 95 % con datos de validacion.
24
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
4.
Comparaci
on y discusiones
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
CWC
0.8974
1.8717
0.6054
Cuadro 1: Comparacion cuantitativa entre modelos lineales, difusos y neuronales para prediccion de la forma y(i + t|t) con i = 1, . . . , 192 para t fijo como instante inicial de la data
de validacion.
resultados aproximando la media. Ahora bien, analizando por modelo y mirando las medidas
de desempe
no RMSE, MAPE y MA, el modelo lineal posee mejores desempe
nos que los demas
modelos para predicciones de peque
nos horizontes ( 1 y 4 ), esto porque predicciones de corto
alcance no requiere de aprendizajes no lineales complejos como lo aprenden los sistemas
difusos y neuronales. Es por esto que analizando las predicciones de mas largo plazo, al
menos el modelo neuronal presenta mejores desempe
nos que el lineal, debido a que la red
es capaz de aprender las frecuencias claves del consumo de potencia para hacer correctas
predicciones.
Ademas de los analisis para medir la calidad de aproximacion de la media, tambien
se hace necesario el analisis de los intervalos de confianza de prediccion del modelo. Los
intervalos de confianza son herramientas u
tiles para analizar cuan confiable es la media que
se esta prediciendo, y para eso existen las metricas adhoc como: PICP, NMPIW y CWC;
en donde PICP mide la proporcion de puntos promedio de la data de validacion que cae
dentro de los intervalos de confianza ( por lo cual entre mas cercana a uno es mejor) ,
NMPIW mide el promedio del ancho del intervalo de confianza normalizado ( por lo cual
mientras mas cercano a cero es mejor) y por u
ltimo el CWC es aquel que se basa en la dos
medidas anteriores haciendo un trade-off entre ellas. El trade-off consiste en tratar de obtener
el intervalo de confianza de menor ancho posible cubriendo la mayor cantidad de datos de
validacion. De esta manera, mirando las metricas PICP, NMPIW y CWC en el Cuadro 2,
los mejores desempe
nos se obtienen para horizontes peque
nos de prediccion contemplados
por 1 y 4. Esto nuevamente porque los funcionales utilizados son adhoc para este tipo de
predicciones. Ahora, para horizontes de prediccion mas grandes, claramente los intervalos
de confianza se vuelven mas imprecisos ( NMPIW mas grandes) y que no necesariamente
tienen abarcan los datos de validacion ( reflejados en PICP mas peque
nos), esto debido a
que en horizontes de tiempos mas grandes las incertidumbres se van acumulando en cada
retroalimentacion de las estructuras. Finalmente, analizando por modelos, para intervalos
peque
nos de prediccion, los intervalos de confianza de cada uno de los modelos no presenta
mayores diferencias, sin embargo para grandes horizontes el modelo neuronal tiene intervalos
menos anchos que los difusos, pero no son precisos a la hora de cubrir la data de validacion.
Tambien cabe mencionar que los modelos difusos tienden a saturar su prediccion a grandes
26
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
horizontes, lo que puede deberse basicamente a que los modelos de las consecuencias no son
suficientes para caracterizar los perfiles de consumo.
Modelo
Predicci
on
1 paso
4 pasos
Lineal
96 pasos
192 pasos
1 paso
4 pasos
Difuso
96 pasos
192 pasos
1 paso
4 pasos
Neuronal
96 pasos
192 pasos
RMSE
1.7495
2.6485
3.8642
4.8683
1.8358
2.7116
5.0537
4.5151
2.2433
3.0171
3.6122
2.5755
MAPE
0.13667
0.2102
0.2436
0.27827
0.1078
0.1488
0.4076
0.2752
0.1490
0.1940
0.2072
0.1732
CWC
1
2.0612
2.1063
2.1237
0.4885
0.4209
2.1804
2.0830
0.9017
0.9206
0.9657
1.4027
Cuadro 2: Comparacion cuantitativa entre modelos lineales, difusos y neuronales para prediccion de la forma y(i0 + t|t) con t = 1, . . . , 96 de la data de validacion e i0 = {1, 4, 96, 192}
pasos de prediccion.
27
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
5.
Conclusiones
28
ticas
Facultad de Ciencias Fsicas y Matema
ctrica
Departamento de Ingeniera Ele
EL7012 Control Inteligente de Sistemas
Referencias
[1] George EP Box, Gwilym M Jenkins, and Gregory C Reinsel. Time series analysis: forecasting and control, volume 734. John Wiley & Sons, 2011.
[2] Richard Dybowski and S Roberts. Confidence intervals and prediction intervals for feedforward neural networks. Clinical Applications of Artificial Neural Networks, pages 298
326, 2001.
[3] Abbas Khosravi, Saeid Nahavandi, Doug Creighton, and Amir F Atiya. Comprehensive
review of neural network-based prediction intervals and new advances. Neural Networks,
IEEE Transactions on, 22(9):13411356, 2011.
[4] I. Skrjanc.
Fuzzy confidence interval for ph titration curve. Appl. Math. Model, pages
4083-4090, 2011.
29