Técnicas De Minería De Datos
Enviado por Susa07 • 26 de Junio de 2015 • 6.175 Palabras (25 Páginas) • 165 Visitas
INTRODUCCIÓN
En la actualidad podemos encontrar grandes volúmenes de información proveniente de diferentes fuentes y dominios que a su vez es automatizada y almacenada dentro de una base de datos digital. A partir de esto surge la necesidad de hacer que la gran cantidad de los datos automatizados y almacenados dentro de un sistema de información ya sea por una empresa, gobierno, particulares, etc., pasen de ser simplemente datos y se conviertan en conocimiento, conocimiento valioso que apoye la toma de decisiones dentro del ambiente donde se han recopilado y extraído los datos. Gran parte de esta información es histórica lo que quiere decir que permite explicar el pasado entender el presente y predecir información futura, de la cual la mayoría de la empresas u organizaciones se basan para tomar decisiones.
El método tradicional de convertir los datos en conocimiento consiste en un análisis e interpretación realizada de forma manual, pero resulta ser lento, caro y altamente sugestivo, de hecho imposible de practicar este método cuando se tienen que manejar grandes volúmenes de información.
Existen otras herramientas analíticas que han sido empleadas para analizar los datos como por ejemplo, lenguajes de consulta estructurada SQL para bases de datos, el data warehouse que incluye operaciones de procesamiento analítico en línea OLAP, herramientas que tienen su origen en la estadística, etc. Algunas de estas herramientas resultan ser poco flexibles, otras no son apropiadas para manejar grandes volúmenes de información, algunas solo permiten generar información resumida y otras no permiten generar patrones, reglas, pautas es decir conocimiento que pueda ser aplicado a otros datos. Todas estas limitaciones han hecho surgir la necesidad de una nueva generación de herramientas y técnicas para soportar la extracción de conocimiento útil desde la información disponible, la minería de datos.
La minería de datos es el proceso de extraer conocimiento útil y comprensible a partir de grandes volúmenes de información (datos convertidos en conocimiento) y así apoyar a la toma de decisiones, en pocas palabras la función principal de la minería es encontrar modelos inteligibles a partir de datos provenientes de diferentes fuentes y en diverso formatos.
Las tareas más importantes en la minería de datos son predictivas, clasificación, estimación de probabilidad, categorización, preferencias, regresión, descriptivas, agrupamiento, reglas de asociación, etc. Cada una de estas tareas requiere métodos y algoritmos para resolverlas que no son más que algoritmos, que se aplican sobre un conjunto de datos para obtener unos resultados.
MÉTODOS DE MINERÍA DE DATOS
REDES NEURONALES ARTIFICIALES
Las redes neuronales artificiales son sistemas conexionistas dentro del campo de la inteligencia artificial, las cuales dependiendo de tipo de arquitectura neuronal, pueden tener diferentes aplicaciones.
Una red neuronal, es un sistema de procesadores paralelos conectados entre sí en forma de grafo dirigido. Esquemáticamente cada elemento de procesamiento (neuronas) de la red se representa como un nodo. Estas conexiones establecen una estructura jerárquica que tratando de emular la fisiología del cerebro busca nuevos modelos de procesamiento para solucionar problemas concretos del mundo real.
Lo importante en el desarrollo de la técnica de las RNA es su útil comportamiento al aprender, reconocer y aplicar relaciones entre objetos y tramas de objetos propios del mundo real. En este sentido, se utilizan como una herramientas que podrá utilizarse para resolver problemas difíciles.
Pueden utilizarse para el reconocimiento de patrones, la comprensión de la información y la reducción de la dimensionalidad, el agrupamiento, la clasificación, la visualización, etc. Ya que muchas de estas tareas lo son también de la minería de datos, las RNA se pueden utilizar como una herramienta para llevar a cabo la minería de datos.
Su ventaja principal es que cuando están bien ajustadas obtienen precisiones muy altas, además son muy expresivas y permiten capturar modelos no lineales, Entre sus inconvenientes se suelen nombrar su sensibilidad a valores anómalos, necesitan muchos ejemplos para el aprendizaje y son relativamente lentas.
Existen dos tipos de RNA aquellas que emplean aprendizaje supervisado y aquellas que utilizan aprendizaje no supervisado. La faceta más interesante del aprendizaje no es solo la posibilidad de que los patrones de entrada puedan ser aprendidos, clasificados, identificados, sino la capacidad de generalización que posee, es decir mientras en aprendizaje tiene lugar en un conjunto de patrones de entrenamiento, una propiedad importante de éste es que la RNA puede generalizar sus resultados en un conjunto de patrones de prueba los cuales se han visto durante el aprendizaje, uno de los problemas a tener en cuenta es el sobreaprendizaje.
1) APRENDIZAJE SUPERVISADO:
Proporcionamos a la red un conjunto de entradas y la respuesta correcta. El conjunto de datos de entrada es propagado hacia adelante hasta que la activación alcanza las neuronas de la capa de salida, entonces podemos comparar la respuesta calculada por la red con aquella que se desea obtener.
Aplicaciones y algoritmos que emplean las Redes neuronales de aprendizaje supervisado:
• Perceptrón simple y Adaline, tiene una estructura de varios nodos o neuronas de entrada y uno o más de salida es un método potente de aprendizaje.
• Perceptrón multicapa, red neuronal en forma de cascada que tiene una o más capas ocultas.
• Algoritmo de retropropagación, algoritmo eficaz para el aprendizaje de MLP.
• Funciones de base radial, la capa de entrad actúa como receptor para el conjunto de datos de entrada.
Para qué tareas de la minería se aplica y ejemplo:
Las RNA con aprendizaje supervisado son aplicadas a campos muy diversos y de forma creciente, se utilizan para problemas de clasificación, regresión, comprensión de datos, optimización, control, etc.
Ejemplo: Las redes neuronales se han utilizado en la predicción de mercados financieros, la clasificación de dígitos escritos a mano, control de robots, la teledetección, etc.
2) APRENDIZAJE NO SUPERVISADO:
Se caracteriza por descubrir modelos o características significativas a partir únicamente de los datos de entrada, no existe por tanto como en el aprendizaje supervisado, un valor de de salida o una clase para cada instancia, con la que poder contrastar la diferencia (obtener un error).
Tipo de aprendizaje que se emplea en las Redes neuronales de aprendizaje supervisado:
...