Data Mining
Enviado por emersonlxxl • 9 de Octubre de 2013 • 462 Palabras (2 Páginas) • 445 Visitas
La revolución digital que se ha ido dando durante los últimos años, ha posibilitado que la captura y el almacenamiento de datos que tenga un coste casi nulo. En la actualidad, las organizaciones pueden disponer de una cantidad enorme de datos almacenados y de los cuales sería de gran ayuda poder sacar información útil.
La mayoría de compañías tienen una gran cantidad de datos almacenados en sus ordenadores. Estos datos contienen una información que puede ser de gran utilidad para los resultados de la empresa. La gran abundancia de datos o su deficiente estructura puede hacer muy difícil extraer esta información útil. El objetivo del Data Mining es la extracción de forma automática de información relevante, útil y no evidente contenida en dichos datos. Existen tres razones fundamentales por las cuales el Data Mining es una realidad en nuestros días:
Avances tecnológicos en almacenamiento masivo de datos y CPU.
Existencia de nuevos algoritmos para extraer información en forma eficiente
Existencia de herramientas automáticas que no hacen necesario el ser un experto en estadística, redes neuronales, o algoritmos matemáticos para convertirse en un DM.
De la necesidad de descubrir conocimiento a partir de los datos, sale el proceso de Descubrimiento de Conocimiento en Bases de Datos o KDD (Knowledge Discovery in Databases).Ese proceso puede ser definido como el proceso no trivial de identificar patrones en los datos que sean válidos, que aporten información desconocida hasta el momento, útiles y comprensibles. El KDD consta de tres partes bien diferenciadas:
1. Pre-procesamiento de los datos.
2. Minería de Datos.
3. Post-procesamiento de los resultados.
I.-DEFINICION
Es un mecanismo de explotación, consistente en la búsqueda de información valiosa en grandes volúmenes de datos.
Es el análisis de archivos y bitácoras de transacciones trabaja a nivel de conocimiento con el fin de descubrir patrones, relaciones, reglas, asociaciones o incluso excepciones útiles para la toma de decisiones.
El proceso más importante es el de Minería de Datos o DM (Data Mining). Una definición formal de la DM sería: La minería de datos es el proceso automático para el Descubrimiento de información útil en grandes cantidades de datos. Este proceso es un campo multidisciplinario, en el que se pretende predecir resultados y/o descubrir relaciones entre los diferentes datos. Las diferentes tareas que puede realizar la Minería de Datos son:
Clasificación: Mediante la clasificación se busca encontrar un modelo que pueda predecir el comportamiento de una variable a partir de sus características.
Análisis de Asociaciones: Estas técnicas pretenden
...