Mineria De Datos
Enviado por finchur • 1 de Julio de 2012 • 3.894 Palabras (16 Páginas) • 3.108 Visitas
RESUMEN
La minería de datos aparece como una de las nuevas tecnologías de manejo, ordenamiento y análisis de los datos, que nos permite encontrar el conocimiento soterrado en las entrañas de las montañas de números, de que se dispone en la actualidad generado por; el aumento en la capacidad en las maquinas procesadoras de datos, la existencia de dispositivos con gran capacidad de almacenamiento de datos a bajo costo, la existencia de sistemas de transmisión de información a grandes velocidades y con mayor confiabilidad. La minería de datos trabaja con los datos como materia prima a la que hay que transformar de su estado bruto a formas que expresen comportamientos, patrones, tendencias, tipos, clases, dimensiones, parámetro, secuencias, asociaciones, que puedan generar algún modelo que nos permita comprender mejor un sistema, o sea extraer la esencia contenida en las bases de datos, extraer el metal precioso, el oro de la montañas de datos, encontrar la veta de conocimiento escondido en su interior y entonces saber; de que, con que, cuando, como, de que manera opera, como falla, como trabaja, como se desarrolla, como crece, como aumenta o disminuye la eficiencia y productividad de un sistema y entonces poder tomar decisiones mejor fundamentadas y de mayor consistencia validacional.
Las cantidades de información en la actualidad son tan enormes que es prácticamente imposible su asimilación por una sola persona, por lo que se hace necesario contar con nuevos métodos de procesamiento de datos, nuevas tecnologías que nos permitan y nos faciliten el proceso de búsqueda del conocimiento escondido al interior de las enormes montañas de datos existentes y que nos proporcionen la esencia contenida en la base de datos.
Se define la minería de datos como un conjunto de procedimientos, técnicas y algoritmos para extraer las relaciones y patrones, la información oculta en las bases de datos. Se establece la relación entre minería de datos y descubrimiento de conocimiento y se describen los pasos en este proceso de descubrimiento. Se abordan las tareas que abarca la minería de datos, las componentes básicas de sus modelos y las técnicas y métodos más usados. Se analizan algunos de los problemas o retos que aún debe enfrentar la minería de datos para su total difusión. Se describen algunas de sus aplicaciones.
Se concluye que, independientemente de la complejidad de la herramienta usada, el empleo de técnicas de minería de datos redunda en beneficio para una organización con grandes bases de datos.
MINERÍA DE DATOS (DATAMINING)
I. DEFINICION
El data mining (minería de datos), es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto.
Básicamente, el data mining surge para intentar ayudar a comprender el contenido de un repositorio de datos. Con este fin, hace uso de prácticas estadísticas y, en algunos casos, de algoritmos de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales.
De forma general, los datos son la materia prima bruta. En el momento que el usuario les atribuye algún significado especial pasan a convertirse en información. Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretación que surge entre la información y ese modelo represente un valor agregado, entonces nos referimos al conocimiento.
Es el conjunto de técnicas para la representación, análisis, manejo y descubrimiento de conocimiento a partir de diversas fuentes de datos (bases de datos, Web, archivos, sensores, etc.). Incluye aspectos de estadística, manejo de conocimiento, computación de alto rendimiento, algoritmos genéticos, redes neuronales, sistemas de soporte a la toma de decisiones, sistemas de información, sistemas distribuidos y bases de datos. El conocimiento extraído se emplea en la toma de decisiones.
La minería de dat1os es la extracción de información im¬plícita, desconocida o previamente ignorada, que puede ser potencialmente útil, de un conjunto de datos. Se pue¬de considerar a la minería de datos como una colección de diferentes técnicas que sirven para inducir el cono¬cimiento e información de una manera estructurada de un gran conjunto de datos.
En general la Minería de Datos involucra diversos temas de otras áreas de la Computación, como muestra la figura.
Temas relacionados con Minería de Datos.
II. HISTORIA
Una definición entre varias que existen es que la minería de datos se entiende como “Un proceso no trivial de identificación válida, novedosa, potencialmente útil y entendible de patrones comprensibles que se encuentran ocultos en los datos” (Fallad y otros 1996).
La minería de datos, surge en los años 60`s con términos tales como: arqueología de datos, pesca de datos en donde se proponía el encuentro de correlaciones sin necesidad de plantear una hipótesis previa de trabajo en una investigación. Al inicio de la década de los años 80`s los investigadores: Gio Weiderhold, Gregor y Pratetsky, Rakesh Agawal y Robert Blum, realizaron trabajos de minería de datos. Diez años después no existían más de dos organismos que aplicaban esta metodología, en la actualidad existen más de 500 empresas en el mundo que trabajan en el desarrollo de nuevas propuestas como soluciones disponibles y son ya más de 150 países los que aportan investigadores al campo de la minería de datos.
La minería de datos se arma en una estructura de varios niveles, pero no es un software de grandes dimensiones, se utilizan técnicas estadísticas de ordenamiento, graficación, correlación, cálculo de parámetros e inteligencia artificial y en cada nivel se usan diferentes tipos de software que hacen a la minería de datos una herramienta de alto poder para el gran número de utilería que contienen y las capacidades para facilitar la formulación y evaluación de proyectos.
Existen referencias de cómo en la actualidad se están aplicando estas técnicas para enfrentar problemas de gran complejidad; en empresas relacionadas con la banca, dependencias gubernamentales, universidades, hospitales, grandes cadenas comerciales y otras organizaciones de servicios preocupados por mantener y hacer crecer su posicionamiento en el mercado ante sus competidores.
Las técnicas de Data Mining son el resultado de un largo proceso de investigación y desarrollo de productos. Esta evolución comenzó cuando los datos de negocios fueron almacenados por primera vez en computadoras, y continuó con mejoras en el acceso a los datos, y más recientemente con tecnologías generadas
...