Data Mining - Minería De Datos
Enviado por Poliie • 3 de Octubre de 2013 • 1.085 Palabras (5 Páginas) • 483 Visitas
MODELOS DE MERCADOTECNIA 1
Sesión No. 2
Nombre: Bases de datos
Contextualización
¿Cómo toman las empresas sus decisiones?
La definición de una base de datos se puede simplificar en una sola palabra: colección. Este concepto se define como la recopilación de elementos de datos relacionados. Los tres elementos básicos que conforman una base de datos son los siguientes: 1) tablas, 2) columnas y 3) filas.
Las tablas, también conocidas como entidades, representan los elementos básicos de información de interés en el seguimiento, tales como clientes, pedidos y facturas.
Introducción al Tema
¿Has escuchado hablar de la minería de datos?
Un dicho popular es el decir que nos encontramos viviendo en la era de la información, cuando en realidad estamos en la época de los datos. Vivimos en un mundo en el que se recopilan diariamente grandes cantidades de información-datos, lo cual conforma una necesidad importante de la población en general.
Este crecimiento explosivo de recopilación de datos almacenados que ha inundado casi todos los aspectos de nuestras vidas, ha generado una necesidad urgente de nuevas técnicas y herramientas automatizadas e inteligentes que nos puedan ayudar en la transformación de la gran cantidad de datos en información en conocimiento útil y aplicable a nuestra vida y los negocios.
Esto ha dado lugar a la generación de una frontera creciente y prometedora conocida como minería de datos y sus diversas aplicaciones. Este concepto también se conoce como KDD (descubrimiento de conocimiento a partir de datos), el cual consta de la extracción automatizada o conveniente de los patrones que representan implícitamente conocimiento almacenado o capturado en grandes bases de datos, almacenes de datos, la web, otros repositorios de información masivos, o flujos de datos.
Por otro lado, las columnas, también conocidas como campos, representan los atributos de una tabla. Estas características pueden ser: el nombre, apellido, dirección, ciudad, estado, código postal, número de teléfono, etc. Importante comentar que estas deben poderse almacenar fácilmente.
El tercer punto son las filas, también conocidos como registros, las cuales representan los datos reales. Los campos describen lo que almacenan los datos, mientras que en las filas de una tabla es donde se almacenan los datos reales.
Explicación
¿Para qué sirve la minería de datos?
La información debe de preparase primeramente antes de iniciar el análisis de la misma. Esto implica observar los atributos y valores de los datos. La información del mundo real suele ser ruidosa, confusa, de alto volumen y puede proceder de una combinación de fuentes heterogéneas. El conocimiento de estas características es útil para pre-procesamiento de datos. Para poder realizar esto, es importante saber lo siguiente: ¿Cuáles son los tipos de atributos o campos y sus componentes? ¿Qué tipo de valores tiene cada atributo? ¿Qué atributos son discretos, y cuáles son los valores continuos? ¿Qué significa que los datos se parezcan? ¿Cómo se distribuyen los valores? ¿Hay maneras en que podemos visualizar los datos para tener una mejor idea de todo esto? ¿Podemos detectar valores atípicos? ¿Podemos medir la similitud de algunos objetos con respecto a los demás? Alcanzar esa visión de los datos ayudará con el análisis posterior.
La minería de datos es el proceso de descubrir patrones y conocimientos interesantes de gran cantidad de datos. El concepto forma parte del proceso de descubrimiento del conocimiento, el cual se compone de los siguientes pasos:
1. Limpieza de datos. Sirve para eliminar el ruido y datos inconsistentes.
...