MINERÍA DE DATOS
Enviado por gunnercr • 27 de Febrero de 2013 • 372 Palabras (2 Páginas) • 644 Visitas
MINERÍA DE DATOS
La Minería de Datos (Data Mining en ingles) es el proceso de encontrar patrones y relaciones en un conjunto de datos mediante el desarrollo de un modelo que permita representarlos.
Una de las dificultades a las que se ha enfrentado la minería de datos desde sus inicios y que, al mismo tiempo, ha justificado su desarrollo, ha sido la necesidad de tratar con enormes bases de datos. Adicionalmente, son cada vez más frecuentes los sistemas de información de naturaleza distribuida, que constan de un sistema de gestión de bases de datos distribuidas, una base de datos donde los datos se distribuyen entre varios nodos y una red para la interconexión. La minería de datos sobre bases de datos distribuidas se conoce como Minería de Datos Distribuida (MDD).
Términos y conceptos de Minería de Datos (Data Mining)
Los conceptos descritos en la especificación son:
1. Data Mining Functions: Las funciones de Minería de Datos se clasifican como supervisadas y no supervisadas. Las supervisadas son utilizadas típicamente para la predicción y necesitan de una respuesta conocida o un objetivo para cada caso en el proceso de generación del modelo. Las no supervisadas, no necesitan dicho objetivo y son usadas normalmente para la descripción de la estructura interna, relaciones o afinidades en el cuerpo de los datos. Otro punto de vista por lo tanto es la predicción o la descripción. JDM describe las siguientes Mining Functions
1. Clasificación
2. Regresión
3. Importancia de los atributos
4. Extracción de características
5. Detección de anomalías
6. Series temporales
7. Clustering
8. Asociación
2. Data Mining Tasks: Las tareas principales en el desarrollo con JDM son
1. Construcción del modelo
2. Prueba del modelo
3. Aplicación del modelo a los datos
4. Calculo de estadísticas
5. Exportación e importación de objetos de mining
3. Data Mining Objects: JDM proporciona la descripción de los principales objetos que intervienen en el código de una aplicación JDM que son clases relativas a:
1. Conexiones
2. URI
3. Tareas
4. Manejo de ejecución y estado
5. Objetos de datos físicos
6. Elementos de datos
7. Preferencias de construcción
8. Algoritmos
9. Preferencias de los Algoritmos
10. Modelos
11. Firmas de modelos
12. Detalles de modelos
13. Atributos lógicos
14. Datos lógicos
15. Conjuntos de datos estadísticos
16. Preferencias de aplicación (de modelos)
17. Matrices de confusión (para describir la fiabilidad de las predicciones de un modelo)
18. Restos
19. Matrices de costes
20. Mayores Probabilidades (facilitando la búsqueda de las características que intervienen
...