Análisis de la demanda eléctrica en España mediante series temporales
Enviado por bernardo jose llamas verna • 7 de Mayo de 2023 • Documentos de Investigación • 10.906 Palabras (44 Páginas) • 144 Visitas
[pic 1]
Análisis de la demanda eléctrica en españa mediante series temporales. Determinación de variables exógenas
Máster Universitario en Ciencia de Datos
2021 - 2022
Nombre y Apellidos del alumno
Bernardo José Llamas Verna |
Nombre y Apellidos del tutor
Lino González García |
Índice de Contenidos
Resumen y Palabras Clave. 4
Agradecimientos. 5
1. Introducción 7
1.1. Contexto y justificación 7
1.2. Objetivos 7
2. Metodología. 8
3. Estado del arte. 8
3.1.- Series temporales 8
3.2. Técnicas de análisis de series temporales 9
3.3.-Variables exógenas para mejorar las predicciones 10
4.- Extracción y preparación de los datos 11
4.1.-Introducción 11
4.2.-Conexión con la API de E-SIOS 11
4.3.-Extracción de datos de temperatura 12
5.- Análisis exploratorio de la demanda eléctrica 13
5.1.-Introducción 13
5.2.-Evolución y estacionariedad de la demanda eléctrica en el período de estudio 13
5.3.- Evolución de la demanda eléctrica 20
5.4.-Incorporación de variables exógenas 25
6.- Modelos de series temporales 26
6.1.- Introducción 26
6.2.- Holt- Winters como modelo de partida 26
6.3.- SARIMAX 27
6.4.- XGBoost 28
6.5.- Prophet 28
6.6.- Métricas escogidas 29
6.7.- Variables exógenas y escenarios escogidos 32
6.8.- Comparación entre modelos 32
6.9.- Comparación de métricas entre modelos 35
7.- Aplicación de los modelos sobre datos a futuro 38
7.1.-Comparativa métricas 38
8.- Conclusiones 40
9.-Siguientes pasos 41
Bibliografía 43
Anexos 48
Resumen y Palabras Clave.
El objetivo del presente trabajo es el análisis y modelización de la demanda eléctrica en el Estado Español entre los años 2014-2021. Se realiza un análisis exploratorio con el fin de encontrar patrones en diferentes granularidades temporales: años, meses, semanas y días. Las conclusiones permitirán la selección de un conjunto de variables exógenas con las que enriquecer los modelos planteados en la segunda parte del trabajo.
A la hora de abordar la modelización, se ha partido de un modelo clásico regresivo (Holt-Winters) como modelo baseline a partir del cual poder comparar el resto de modelos, todos basados en técnicas más avanzadas: SARIMAX, XGBoost y Prophet.
Mediante la comparativa de métricas se han determinado cómo afectan las variables exógenas, así como el mejor modelo descriptivo de la serie.
Palabras Clave: Series temporales, forecasting, demanda eléctrica, predicción, variables exógenas.
Agradecimientos.
2021-2022, un curso complicado, se podría decir en resumen para comenzar estas líneas. El año pasado sobre estas fechas estaba cansado de lo que estaba haciendo con mi vida profesional, afectando a su vez a mi vida personal. La sensación de no encontrar definitivamente mi sitio y una nostalgia cada vez más acentuada de mis tiempos como estudiante de Ciencias Físicas me llevaban a plantearme por qué no seguí un poco más la carrera de investigación, qué sitio podría encontrar donde poder reencontrarme, etc. Obviamente la opción de todo lo relacionado con el mundo del dato estaba ahí, pero me era difícil que en una entrevista de trabajo pudieran ver más allá de mi experiencia como desarrollador de software, más que lo que podía aportar como físico en esa área, y la desesperación crecía.
...