Mineria De Datos
Enviado por aopen82 • 10 de Marzo de 2013 • 2.115 Palabras (9 Páginas) • 452 Visitas
indic
Índice.
Introducción……………………………………………………………………………………………………………………..Pág. 03
Problemáticas de MD..……………………………………………………………………………………………………..Pág. 04
Desarrollo de la DKK.………………………………………………………………………………………………………..Pág. 04
Áreas de Interés de la MD.………………………………………………………………………………………………..Pág. 06
Tareas de la Minería de Datos…………………………………………………………………………………………..Pág. 08
OLAP..……………………………………………………………………………………………………………………………….Pág. 09
Conclusión..………………………………………………………………………………….…………………………………..Pág. 10
Bibliografía..………………………………………………………………………………….…………………………………..Pág. 11
Introducción.
La minería de datos es un proceso de extracción de tendencias y patrones de un archivo de datos previamente elaborado.
A medida que se almacenan más datos, la cantidad de datos se duplica, la minería de datos se está convirtiendo en una herramienta cada vez más importante para transformar esos datos en información.
Si bien la minería de datos se utiliza para descubrir patrones en las muestras de datos al igual que cualquier otra herramienta, sólo funciona en relación con la materia prima adecuada: en este caso, indicativa y datos representativos, que el usuario primero debe recoger.
Además, el descubrimiento de un patrón particular en un determinado conjunto de datos no significa necesariamente que el patrón es representativo.
Desarrollo.
Problemática de MD.
Dentro de los principales problemas de la minería de datos, es que las técnicas empleadas no nos ayuden a identificar patrones, que permitan al usuario contar con la información necesaria para la toma de decisiones.
Desarrollo de KDD.
El proceso de minería de datos pertenece a un esquema más amplio denominado extracción o descubrimiento de conocimiento en bases de datos, en inglés, Knowledge Discovery in Databases, más conocido por las siglas KDD.
El proceso KDD tiene como núcleo principal la minería de datos, que mediante una preparación previa de una cantidad inmensa de datos, por lo general almacenados en muchas veces de datos, se aplica un algoritmo de minería de datos para sacar el conocimiento implícito en estos y poder ser utilizado en la vida real para poder ayudar a multitud de campos.
Las etapas a seguir en el proceso KDD son las siguientes:
1. Determinación de objetivos: Es necesario identificar que datos seleccionamos para que sean compatibles para aplicar minería de datos y además precisar qué objetivos quieren cumplirse desde el punto de vista del usuario.
2. Preparación de los Datos: Depurar la fuente de datos para evitar problemas comunes, pueden contener ambigüedades, ruido o, simplemente, no estar en el formato adecuado para su posterior procesamiento.
3. Minería de Datos: Todas las etapas anteriores son necesarias para que la aplicación de un algoritmo de minería sea exitoso y se puede sacar el conocimiento implícito en los datos que nos interesan.
Estructura interna de la Minería de datos
El aprendizaje automático o machine learning es una rama de la Inteligencia Artificial que estudia el desarrollo de técnicas para extraer de forma automática conocimiento subyacente en infinidad de información, en minería se utilizan dos tipos: Supervisado y No Supervisado.
Una vez terminada la fase del aprendizaje, se procede a representar el conocimiento mediante un modelo.
La fase de la validación del conocimiento es la encargada de verificar si los resultados obtenidos del aprendizaje y representados posteriormente mediante un modelo de visualización han sido obtenidos de forma totalmente al azar, o de otro modo el resultado obtenido tiene una razón de ser que es difícilmente de ver a simple vista. Aquí es donde entra en juego el Análisis estadístico que nos ayudará a evaluar estos casos.
Una vez terminada la validación, se deben haber eliminado aquellos casos que mediante el análisis estadístico se consideró que surgieron totalmente al azar.
Después de esto se vuelve a entrar de nuevo en el ciclo de la minería de datos hasta que la depuración de todos los datos sea tal, que podamos salir de este ciclo con todos los casos verdaderos que tienen un porqué.
4. Análisis e Interpretación: En esta etapa se estudia, interpreta y evalúa el modelo de conocimiento generado por el algoritmo de minería de datos. El uso de técnicas de visualización facilita al usuario la comprensión, permitiendo la aplicación de este en la toma de decisiones.
Ejemplo de modelo de visualización.
5. Aplicación: Integración del conocimiento adquirido al campo real para su aplicación, si procede.
Áreas de Interés de MD
Negocios
La minería de datos puede contribuir significativamente en las aplicaciones de administración empresarial basada en la relación con el cliente. En lugar de contactar con el cliente de forma indiscriminada a través de un centro de llamadas o enviando cartas, sólo se contactará con aquellos que se perciba que tienen una mayor probabilidad de responder positivamente a una determinada oferta o promoción.
Por lo general, las empresas que emplean minería de datos ven rápidamente el retorno de la inversión, pero también reconocen que el número de modelos predictivos desarrollados puede crecer muy rápidamente.
Hábitos de compra en supermercados
El ejemplo clásico de aplicación de la minería de datos tiene que ver con la detección de hábitos de compra en supermercados. Un estudio muy citado detectó que los viernes había una cantidad inusualmente elevada de clientes que adquirían a la vez pañales y cerveza. Se detectó que se debía
...