Modelado de Minería de Datos
Enviado por Javier Henao Arredondo • 11 de Marzo de 2023 • Informe • 3.341 Palabras (14 Páginas) • 50 Visitas
[pic 1]
Modelado de Minería de Datos
Primera Entrega
Yenny Marcela Horta Calderón Cod.100302693 Q03, Sindy Paola Barrantes Vargas Cod.100302026 Q03, Javier Mauricio Sánchez Caldas Cod. 100299700 Q04, José Hernán Garavito Calderón Cod. 100299702 Q04, Cesar Augusto Reyes Silva Cod. 100302936 Q03.
Politécnico Grancolombiano
Especialización en Gerencia de Proyectos en Inteligencia de Negocios
Minería de Datos
Juan Carlos Plazas Gil
Bogotá D.C., Colombia 01 de noviembre de 2022
Tabla de contenido
Introducción 4
1. Metodología 4
CRISP-DM 4
1.1.Comprensión del Negocio………………. 5
Contaminantes atmosféricos 5
Contexto 8
Objetivos de la Organización 8
Evaluación de la situación 11
Objetivos de minería de datos 11
Producción del plan del proyecto 12
1.2.Comprensión de datos……… 13
Recolección de datos 13
Descripción de los datos 15
Exploración de datos 18
Calidad de Datos 19
1.3. Preparación de Datos……… 19
Selección de datos 19
Limpieza de datos 20
Construcción de nuevos datos 20
Integridad de datos 21
Formato de datos 21
Listado de Figuras
Figura 1. Modelo de proceso CRISP-DM
Figura 2. Modelo de base de datos a utilizar
Listado de Tablas
Tabla 1. Contaminantes atmosféricos
Tabla 2. Variables de recolección de datos
Tabla 3. Descripción de datos
Tabla 4. Base de datos Estaciones meteorológicas
Introducción
En la actualidad uno de los mayores problemáticas a nivel mundial es la contaminación atmosférica, que tiene efectos sobre el medio ambiente, y a su vez, tiene una gran incidencia sobre la salud de los seres vivos, llegando a causar afectaciones dermatológicas y respiratorias; siendo la contaminación del aire es también la mayor causante de muertes prematuras según la Organización Mundial de la Salud (OMS), según reporte la cifra asciende a 2.4 millones de personas mueren cada año a causa de la contaminación del aire (Lanjewar & Shah, 2012).
Factores como el uso de combustibles fósiles tanto en el transporte como en procesos de combustión industrial, la suspensión de material particulado de las vías, las quemas e incendios no controlados de biomasa en regiones cercanas, generan y provocan mayores enfermedades respiratorias.
Teniendo en cuenta la importancia del tema, se plantea como objetivo de este proyecto analizar la relación entre contaminantes atmosféricos y sectores determinados del sur de Bogotá, con la finalidad de identificar patrones de comportamiento de los contaminantes en cada sector, de esta manera, generar conocimiento en beneficio de la sociedad y mejorar la calidad de vida de las personas.
- Metodología
CRISP-DM
Para el desarrollo del trabajo se utilizó como base de referencia la metodología CRISP – DM (Figura 1), la cual es una de las más utilizadas a nivel general para la realización de proyectos, cuenta con seis etapas que se indica en el proceso y se deben seguir para cumplir con la forma correcta un proyecto de minería de datos.
Figura 1. Modelo de proceso CRISP-DM
[pic 2]
Imagen que describe las etapas de la metodología CRISP-DM para proyectos de minería de datos.
- Comprensión del Negocio
Contaminantes atmosféricos
Los datos de contaminantes atmosféricos proporcionados pertenecen al mismo rango de tiempo de medición, donde se analizan patrones de medición que están almacenados en una hora específica, es decir en la misma hora se toma la medición para todos los contaminantes en todos los sectores.
Tabla 1
Contaminantes atmosféricos
Contaminante atmosférico | Abreviatura | Unidad |
Ozono | O3 | ppb |
Monóxido de carbono | CO | ppm |
Dióxido de Nitrógeno | NO2 | ppb |
Dióxido de Azufre | SO2 | ppb |
Material Particulado | MP2.5 | µg/m3 |
Material Particulado | MP10 | µg/m3 |
Ozono (O3)
El ozono es un gas compuesto de tres átomos de oxígeno, el aire que respiramos consta únicamente de dos átomos, cuando el gas se encuentra presente en la atmósfera sirve de filtro contra los rayos ultra violetas, sin embargo cuando se encuentra presente en la superficie terrestre causa afecciones a las personas como: enfermedades respiratorias crónicas y la incapacidad del sistema inmunológico para defender al sistema respiratorio (PNUMA, 2013).
...