Data Warehouse
Enviado por manuelfi • 11 de Mayo de 2014 • 225 Palabras (1 Páginas) • 253 Visitas
RECOPILACIÓN e INTEGRACIÓN
Reunir un conjunto de datos que posibilite la extracción de conocimiento requiere decidir:
Fuentes internas
Fuentes externas,
¿Cómo se van a organizar?
¿Cómo se van a mantener con
el tiempo?
¿De qué forma se van a poder
extraer? parcial o totalmente,
en detalle o agregados
Los almacenes de datos (data warehouse) no son estrictamente necesarios para realizar minería de datos, aunque sí útiles si se va a trabajar con grandes volúmenes de datos, que varían con el tiempo y donde se desea realizar las tareas de minería de datos.
Ejemplo
Una compañía europea quiere analizar aquellos países y gamas de productos en los que las ventas vayan excepcionalmente bien para premiar a las mejores oficinas comerciales.
De cada venta se registra
la fecha,
cantidad,
comprador y
país.
¿es esta información suficiente para realizar el análisis anterior?
Si no tenemos en cuenta la población de cada país; será muy probable que no nos proporcione la realidad, y resulte que entre los países con mayores ventas este Alemania, y con menores ventas se encuentre San Marino, y sea lo opuesto.
Sí deseamos hacer un análisis más profundo, revisaremos:
la renta per cápita de cada país o
la distribución por edad de cada país o
información externa como horas de sol anuales de cada país para una compañía de cosméticos.
Lógicamente es más difícil vender bronceadores en un lugar que en otro.
...