“DATA MINING – MINERIA DE DATOS”
Enviado por haker912 • 14 de Agosto de 2019 • Trabajo • 6.626 Palabras (27 Páginas) • 140 Visitas
ASOCIACIÓNUNIVERSIDAD PRIVADA
SAN JUAN BAUTISTA
FACULTAD DE INGENIERÍA
ESCUELA PROFESIONAL DE INGENIERÍA DE COMPUTACIÓN Y SISTEMAS[pic 1]
“DATA MINING – MINERIA DE DATOS”
PROYECTO DE TITULACION
PRESENTADO POR:
Xxxxxxxxxxx
Xxxxxxxxxxx
xxxxxxxxxxxx
TITULO
PARA OPTAR EL TÍTULO PROFESIONAL DE
INGENIERÍA DE COMPUTACIÓN Y SISTEMAS
LIMA – PERÚ
2013
DEDICATORIA
Se lo dedicamos a nuestros padres por el apoyo incondicionales a y nuestros profesores por formanos como profesionales
AGRADECIMIENTOS
En el camino recorrido hasta aquí tuve la oportunidad de conocer a muchas personas que contribuyeron en mayor o menor medida a la realización de este trabajo. Quiero agradecerles a todas ellas por el tiempo y dedicación prestados.
- Prof. Zico Alexis
- Dr.Miller Liendo, Profesor y autor de Datawearhouse por la información proporcionada.
- Jefe de Word Place Externo Leopoldo Rijavec por el apoyo solicitado.
INDICE
INTRODUCCIÓN 5
CAPITULO I - CONCEPTOS BÁSICOS 7
1.2 Historia 7
1.3 Antecedentes y necesidades 8
1.4 Los Fundamentos del Data Mining 8
1.5 Principales características y objetivos de la Minería de Datos 9
1.6 Alcance de Data Mining 12
1.7 Extracción de conocimiento en bases de datos 13
1.8 Técnicas de Minería de Datos 14
CAPITULO II - ARQUITECTURA DATA MINING 17
2.1 Una arquitectura para Data Mining 17
2.2 Fases de un Proyecto 18
2.3 Filtrado de datos 19
2.4 Selección de variables 19
2.5 Algoritmos de Extracción de Conocimiento 20
2.6 Interpretación y evaluación 21
CAPITULO III - Aplicaciones de Casos del Data Mining 22
4.1. Gobierno 22
4.2. Empresa 23
4.3. Universidad 25
4.4. Investigaciones Espaciales 26
4.5. Clubes Deportivos 26
CAPITULO IV - SOFTWARE WEKA 28
4.1. Software de minería de datos en Java 28
4.2. WEKA Knowledge Explorer 30
4.3. El algoritmo J4.8 31
CONCLUSIÓN 33
BIBLIOGRAFÍA 34
GLOSARIO DE TÉRMINOS 35
INTRODUCCIÓN
El Data Mining surgió como una técnica novedosa a la situación en la cual se contaban con grandes volúmenes de datos en los cuales no se aprovechaba toda la información útil, ya que esta se encontraba oculta de alguna forma. El descubrimiento de esta data útil se logra a través de procesos de redes neuronales, árboles de decisión, modelos estadísticos y agrupamientos, lo cuales permiten hallar patrones de conducta en los datos, y de esta forma realizar predicciones para dar soporte a la toma de decisiones en el ámbito en el que fue aplicado.
Es importante destacar que el uso de esta técnica no va dirigida a un público específico, sino que cualquier persona con un buen dominio de las herramientas de extracción puede ejercer el rol de minero, así mismo el entorno de la minería de datos suele desarrollarse bajo una arquitectura cliente-servidor.
En la minería de datos se desarrollarán tópicos como, el proceso de extracción de conocimiento, para luego dar pie al concepción del data mining seguidamente se hondará en las principales características y objetivos del mismo, tomando en cuenta el alcance que posee y la arquitectura en la cual se desarrolla.
De igual manera se deben resaltar las fases de un proyecto de data mining y las aplicaciones que se le pueden dar a la técnica mencionada.
Los procesos de la minería de datos pueden agruparse en 4 pasos generales independientemente de la técnica que se use, estos son: Filtrado de datos, Selección de variables, Extracción de Conocimiento e Interpretación y evaluación.
Dentro de estas enormes masas de datos existe una gran cantidad de información oculta, de gran importancia estratégica, a la que no se puede acceder por las técnicas clásicas de recuperación de la información. El descubrimiento de esta información oculta es posible gracias a la Minería de Datos (DataMining), que entre otras sofisticadas técnicas aplica la inteligencia artificial para encontrar patrones y relaciones dentro de los datos permitiendo la creación de modelos, es decir, representaciones abstractas de la realidad, pero es el descubrimiento del conocimiento (KDD, por sus siglas en inglés) que se encarga de la preparación de los datos y la interpretación de los resultados obtenidos, los cuales dan un significado a estos patrones encontrados.
...