Mineria De Datos

aopen8210 de Marzo de 2013

2.115 Palabras (9 Páginas)593 Visitas

Página 1 de 9

indic

Índice.

Introducción……………………………………………………………………………………………………………………..Pág. 03

Problemáticas de MD..……………………………………………………………………………………………………..Pág. 04

Desarrollo de la DKK.………………………………………………………………………………………………………..Pág. 04

Áreas de Interés de la MD.………………………………………………………………………………………………..Pág. 06

Tareas de la Minería de Datos…………………………………………………………………………………………..Pág. 08

OLAP..……………………………………………………………………………………………………………………………….Pág. 09

Conclusión..………………………………………………………………………………….…………………………………..Pág. 10

Bibliografía..………………………………………………………………………………….…………………………………..Pág. 11

Introducción.

La minería de datos es un proceso de extracción de tendencias y patrones de un archivo de datos previamente elaborado.

A medida que se almacenan más datos, la cantidad de datos se duplica, la minería de datos se está convirtiendo en una herramienta cada vez más importante para transformar esos datos en información.

Si bien la minería de datos se utiliza para descubrir patrones en las muestras de datos al igual que cualquier otra herramienta, sólo funciona en relación con la materia prima adecuada: en este caso, indicativa y datos representativos, que el usuario primero debe recoger.

Además, el descubrimiento de un patrón particular en un determinado conjunto de datos no significa necesariamente que el patrón es representativo.

Desarrollo.

Problemática de MD.

Dentro de los principales problemas de la minería de datos, es que las técnicas empleadas no nos ayuden a identificar patrones, que permitan al usuario contar con la información necesaria para la toma de decisiones.

Desarrollo de KDD.

El proceso de minería de datos pertenece a un esquema más amplio denominado extracción o descubrimiento de conocimiento en bases de datos, en inglés, Knowledge Discovery in Databases, más conocido por las siglas KDD.

El proceso KDD tiene como núcleo principal la minería de datos, que mediante una preparación previa de una cantidad inmensa de datos, por lo general almacenados en muchas veces de datos, se aplica un algoritmo de minería de datos para sacar el conocimiento implícito en estos y poder ser utilizado en la vida real para poder ayudar a multitud de campos.

Las etapas a seguir en el proceso KDD son las siguientes:

1. Determinación de objetivos: Es necesario identificar que datos seleccionamos para que sean compatibles para aplicar minería de datos y además precisar qué objetivos quieren cumplirse desde el punto de vista del usuario.

2. Preparación de los Datos: Depurar la fuente de datos para evitar problemas comunes, pueden contener ambigüedades, ruido o, simplemente, no estar en el formato adecuado para su posterior procesamiento.

3. Minería de Datos: Todas las etapas anteriores son necesarias para que la aplicación de un algoritmo de minería sea exitoso y se puede sacar el conocimiento implícito en los datos que nos interesan.

Estructura interna de la Minería de datos

El aprendizaje automático o machine learning es una rama de la Inteligencia Artificial que estudia el desarrollo de técnicas para extraer de forma automática conocimiento subyacente en infinidad de información, en minería se utilizan dos tipos: Supervisado y No Supervisado.

Una vez terminada la fase del aprendizaje, se procede a representar el conocimiento mediante un modelo.

La fase de la validación del conocimiento es la encargada de verificar si los resultados obtenidos del aprendizaje y representados posteriormente mediante un modelo de visualización han sido obtenidos de forma totalmente al azar, o de otro modo el resultado obtenido tiene una razón de ser que es difícilmente de ver a simple vista. Aquí es donde entra en juego el Análisis estadístico que nos ayudará a evaluar estos casos.

Una vez terminada la validación, se deben haber eliminado aquellos casos que mediante el análisis estadístico se consideró que surgieron totalmente al azar.

Después de esto se vuelve a entrar de nuevo en el ciclo de la minería de datos hasta que la depuración de todos los datos sea tal, que podamos salir de este ciclo con todos los casos verdaderos que tienen un porqué.

4. Análisis e Interpretación: En esta etapa se estudia, interpreta y evalúa el modelo de conocimiento generado por el algoritmo de minería de datos. El uso de técnicas de visualización facilita al usuario la comprensión, permitiendo la aplicación de este en la toma de decisiones.

Ejemplo de modelo de visualización.

5. Aplicación: Integración del conocimiento adquirido al campo real para su aplicación, si procede.

Áreas de Interés de MD

Negocios

La minería de datos puede contribuir significativamente en las aplicaciones de administración empresarial basada en la relación con el cliente. En lugar de contactar con el cliente de forma indiscriminada a través de un centro de llamadas o enviando cartas, sólo se contactará con aquellos que se perciba que tienen una mayor probabilidad de responder positivamente a una determinada oferta o promoción.

Por lo general, las empresas que emplean minería de datos ven rápidamente el retorno de la inversión, pero también reconocen que el número de modelos predictivos desarrollados puede crecer muy rápidamente.

Hábitos de compra en supermercados

El ejemplo clásico de aplicación de la minería de datos tiene que ver con la detección de hábitos de compra en supermercados. Un estudio muy citado detectó que los viernes había una cantidad inusualmente elevada de clientes que adquirían a la vez pañales y cerveza. Se detectó que se debía a que dicho día solían acudir al supermercado padres jóvenes cuya perspectiva para el fin de semana consistía en quedarse en casa cuidando de su hijo y viendo la televisión con una cerveza en la mano. El supermercado pudo incrementar sus ventas de cerveza colocándolas próximas a los pañales para fomentar las ventas compulsivas.

Patrones de fuga

Un ejemplo más habitual es el de la detección de patrones de fuga. En muchas industrias —como la banca, las telecomunicaciones, etc.— existe un comprensible interés en detectar cuanto antes aquellos clientes que puedan estar pensando en rescindir sus contratos para, posiblemente, pasarse a la competencia. A estos clientes —y en función de su valor— se les podrían hacer ofertas personalizadas, ofrecer promociones especiales, etc., con el objetivo último de retenerlos. La minería de datos ayuda a determinar qué clientes son los más proclives a darse de baja estudiando sus patrones de comportamiento y comparándolos con muestras de clientes que, efectivamente, se dieron de baja en el pasado.

Fraudes

Un caso análogo es el de la detección de transacciones de lavado de dinero o de fraude en el uso de tarjetas de crédito o de servicios de telefonía móvil e, incluso, en la relación de los contribuyentes con el fisco. Generalmente, estas operaciones fraudulentas o ilegales suelen seguir patrones característicos que permiten, con cierto grado de probabilidad, distinguirlas de las legítimas

...

Descargar como (para miembros actualizados) txt (15 Kb)

Leer 8 páginas más »

Leer documento completo Guardar

Disponible sólo en Clubensayos.com