Análisis de la demanda eléctrica en España mediante series temporales
bernardo jose llamas vernaDocumentos de Investigación7 de Mayo de 2023
10.906 Palabras (44 Páginas)187 Visitas
[pic 1]
Análisis de la demanda eléctrica en españa mediante series temporales. Determinación de variables exógenas
Máster Universitario en Ciencia de Datos
2021 - 2022
Nombre y Apellidos del alumno
Bernardo José Llamas Verna |
Nombre y Apellidos del tutor
Lino González García |
Índice de Contenidos
Resumen y Palabras Clave. 4
Agradecimientos. 5
1. Introducción 7
1.1. Contexto y justificación 7
1.2. Objetivos 7
2. Metodología. 8
3. Estado del arte. 8
3.1.- Series temporales 8
3.2. Técnicas de análisis de series temporales 9
3.3.-Variables exógenas para mejorar las predicciones 10
4.- Extracción y preparación de los datos 11
4.1.-Introducción 11
4.2.-Conexión con la API de E-SIOS 11
4.3.-Extracción de datos de temperatura 12
5.- Análisis exploratorio de la demanda eléctrica 13
5.1.-Introducción 13
5.2.-Evolución y estacionariedad de la demanda eléctrica en el período de estudio 13
5.3.- Evolución de la demanda eléctrica 20
5.4.-Incorporación de variables exógenas 25
6.- Modelos de series temporales 26
6.1.- Introducción 26
6.2.- Holt- Winters como modelo de partida 26
6.3.- SARIMAX 27
6.4.- XGBoost 28
6.5.- Prophet 28
6.6.- Métricas escogidas 29
6.7.- Variables exógenas y escenarios escogidos 32
6.8.- Comparación entre modelos 32
6.9.- Comparación de métricas entre modelos 35
7.- Aplicación de los modelos sobre datos a futuro 38
7.1.-Comparativa métricas 38
8.- Conclusiones 40
9.-Siguientes pasos 41
Bibliografía 43
Anexos 48
Resumen y Palabras Clave.
El objetivo del presente trabajo es el análisis y modelización de la demanda eléctrica en el Estado Español entre los años 2014-2021. Se realiza un análisis exploratorio con el fin de encontrar patrones en diferentes granularidades temporales: años, meses, semanas y días. Las conclusiones permitirán la selección de un conjunto de variables exógenas con las que enriquecer los modelos planteados en la segunda parte del trabajo.
A la hora de abordar la modelización, se ha partido de un modelo clásico regresivo (Holt-Winters) como modelo baseline a partir del cual poder comparar el resto de modelos, todos basados en técnicas más avanzadas: SARIMAX, XGBoost y Prophet.
Mediante la comparativa de métricas se han determinado cómo afectan las variables exógenas, así como el mejor modelo descriptivo de la serie.
Palabras Clave: Series temporales, forecasting, demanda eléctrica, predicción, variables exógenas.
Agradecimientos.
2021-2022, un curso complicado, se podría decir en resumen para comenzar estas líneas. El año pasado sobre estas fechas estaba cansado de lo que estaba haciendo con mi vida profesional, afectando a su vez a mi vida personal. La sensación de no encontrar definitivamente mi sitio y una nostalgia cada vez más acentuada de mis tiempos como estudiante de Ciencias Físicas me llevaban a plantearme por qué no seguí un poco más la carrera de investigación, qué sitio podría encontrar donde poder reencontrarme, etc. Obviamente la opción de todo lo relacionado con el mundo del dato estaba ahí, pero me era difícil que en una entrevista de trabajo pudieran ver más allá de mi experiencia como desarrollador de software, más que lo que podía aportar como físico en esa área, y la desesperación crecía.
Por azares de la vida terminé contactando con Lino, que es el tutor del presente trabajo, y me ofreció la posibilidad de hacer un doctorado o hacer este máster. Al final me decanté por el máster viendo que el programa se adaptaba a lo que quería hacer.
Agradezco finalmente el haber realizado el máster a pesar de lo complicado que ha sido trabajar, estudiar e intentar vivir. Finalmente el ansiado cambio de departamento en mi empresa se ha dado y ahora estoy en mi primer proyecto como científico de datos.
Pero también tengo que agradecerle a muchas personas.
A los primeros que toca agradecer es a mis padres por todo lo que han hecho y siguen haciendo por mi. El estar en la vida adulta e intentar realizar un proyecto de vida propio, da una dimensión mucho mayor de todo el sacrificio que han hecho y siguen haciendo por sus hijos y ni de lejos habría conseguido lo que he conseguido hasta ahora sin su apoyo. Aquí mi reconocimiento.
A mis abuelos, ya sea en las montañas de León o en Caracas, por haber sacado adelante a mis padres con todo lo que pudieron.
A mis hermanos, aunque la vida adulta nos lleve por caminos separados, el recuerdo de una bonita infancia no se borrará jamás.
A mis amigos, que este año más de una vez les he tenido que rechazar planes por tener que dedicarle tiempo a este máster. En especial agradecer a Pérez que me ayudase con el curso de DevOps que hice en paralelo a este; las 2 tardes en su casa haciendo prácticas se las agradeceré infinito por siempre.
A Victoria, por animarme a realizar este curso cuando a lo mejor asomaba la sombra de duda y por haber sido paciente cuando no nos podíamos ver o tenía que desaparecer para conseguir realizar una entrega a tiempo.
A mi grupo de amigos de Data, Blockchain y NFT, Maddi, Manu, Claudia y Diego por ayudarme a elegir y estructurar este tema de investigación. La extracción de datos de temperaturas y cómo procesarlos se lo debo a Claudia y la selección de las ciudades donde sacar las temperaturas a Manu.
A Diego aquí es al que más hay que agradecer. No solo estructuró el proyecto, cómo abordarlo, etc, sino que también ha estado ahí para resolver cualquier tipo de duda, revisar casi al instante esta tesis, dando ideas, correcciones, etc. Agradecer infinitamente es insuficiente sabiendo el poco tiempo que tiene siendo padre primerizo y corredor semiprofesional. Casi ha sido como volver a nuestras prácticas de laboratorio en la facultad. Muchas gracias amigo.
Antes de terminar quisiera decir que los amigos de verdad son los que se conocen antes de los 30 y, antes de que Diego levante la vista de esta página cual Robin Williams en el Indomable Will Hunting reclamando una frase robada, quisiera añadir un corolario:
Los amigos de verdad son los que conoces antes de los 30 y los que nunca fallan son aquellos con los que tienes que buscar gasolina en medio de viento, lluvia y nieve en la mitad de la nada en Anatolia.
Madrid, 16 de julio del año 2022
Introducción
1.1.- Contexto y justificación
Los mercados de electricidad se diferencian de otros mercados por la necesidad de producir la energía en el mismo instante que es consumida, manteniendo un balance casi perfecto.
...