Presentacion 1
Presentacion 1
Presentacion 1
STOCKS
Ernesto Anaya
Guillermo Naranjo
Mariano Alcaraz
Muy bien por la definición
PROBLEMA
Predecir las tendencias del mercado
mediante el análisis de series de tiempo Tipo de
de precios de acciones y el sentimiento problema
de noticias financieras Regresión
ORIGEN
DATOS NOTICIAS
Stock data
Yahoo Finance Títulos de noticias:
Noticias 2,062,224
Polygon 2017: 564,041
GDELT
2018: 474,507
Sentimientos 2019: 448,364
FinBERT 2020: 38,463
2021: 25,896
2022: 510,953
TAMAÑO *Para días faltantes se obtuvo el
Filas tono dado por GDELT
1,568
Inicio: 3/enero/2017
Fin: 27/marzo/2023 DATOS
Columnas FALTANTES
738
357 empresas 0 NA
Stock close 56 días sin datos (sin
Sentimiento promedio por día
FORMATO contar fines de
8 indicadores
16 agrupaciones a nivel industria semana)
Tabular
Texto
DISTRIBUCIONES Muy bien por el EDA
Muy bien
PARÁMETROS ÉPOCAS
2,777,470
50
REGULARI-
OPTIMIZADOR
ZADORES
Batch Norm
Dropout(0.2) rmsdrop
LOSS TI EMPO
FUNCTION ENTRENAMI ENTO
mse 1 min
Resultados
Resultados
lstm v1 1 día adelante
Otros optimizadores
OPTIMIZADOR
Adam
OPTIMIZADOR
Adadelta
lstm V2
1 día adelante
PARÁMETROS ÉPOCAS
80,699,750
50
REGULARI-
OPTIMIZADOR
ZADORES
Batch Norm
Dropout(0.2) rmsdrop
LOSS TI EMPO
FUNCTION ENTRENAMI ENTO
mse 2 min
Resultados
lstm V1 5 días adelante
RMSDROP
PARÁMETROS ÉPOCAS
2,777,470
50
REGULARI-
OPTIMIZADOR
ZADORES
Batch Norm
Dropout(0.2) rmsdrop
LOSS TI EMPO
FUNCTION ENTRENAMI ENTO
mse 5 mins
Resultados
lstm V1 5 días adelante
ADAM
PARÁMETROS ÉPOCAS
2,777,470
50
REGULARI-
OPTIMIZADOR
ZADORES
Batch Norm
Dropout(0.2) Adam
LOSS TI EMPO
FUNCTION ENTRENAMI ENTO
mse 1 min
Resultados
lstm V2 5 días adelante
RMSDROP
PARÁMETROS ÉPOCAS
80,699,750
50
REGULARI-
OPTIMIZADOR
ZADORES
Batch Norm
Dropout(0.2) rmsdrop
LOSS TI EMPO
FUNCTION ENTRENAMI ENTO
mse 5 mins
Resultados
lstm V2 5 días adelante
ADAM
PARÁMETROS ÉPOCAS
80,699,750
50
REGULARI-
OPTIMIZADOR
ZADORES
Batch Norm
Dropout(0.2) adam
LOSS TI EMPO
FUNCTION ENTRENAMI ENTO
mse 5 mins
Resultados
Está bien estos resultados, pero esperaba primero mucho énfasis en el mejor modelo, y después las otras combinaciones.
Bien por las observaciones
Discusión
1 día adelante
5 días adelante
Desde un punto de vista de una presentación para el cliente/jefe, es mejor ir directo al grano y presentar primero la mejor solución encontrada. Ya después se dan los detalles y las
comparaciones con otros intentos realizados.
Referencias
Documentación Keras: https://keras.io/keras_nlp/
Documentación Tensorflow:
https://www.tensorflow.org/api_docs/python/tf/keras/layers/Layer
GDELT: https://www.gdeltproject.org/
Polygon: https://polygon.io/
Tillya. S, Ebnerb. M & Livan G: Macroeconomic forecasting through news, emotions and
narrative (Agosto 2021)
Muhammed et al. Transformer-Based Deep Learning Model for Stock Price Prediction: A
Case Study on Bangladesh Stock Market (Agosto 2022)