DATAWAREHOUSE
Enviado por marcosfac • 11 de Agosto de 2014 • 296 Palabras (2 Páginas) • 225 Visitas
INTRODUCCION
Un Datawarehouse es una base de datos corporativa que se caracteriza por integrar y depurar información de una o más fuentes distintas, para luego procesarla permitiendo su análisis desde infinidad de perspectivas y con grandes velocidades de respuesta. La creación de un datawarehouse representa en la mayoría de las ocasiones el primer paso, desde el punto de vista técnico, para implantar una solución completa y fiable de Business Intelligence.
La ventaja principal de este tipo de bases de datos radica en las estructuras en las que se almacena la información (modelos de tablas en estrella, en copo de nieve, cubos relacionales... etc). Este tipo de persistencia de la información es homogénea y fiable, y permite la consulta y el tratamiento jerarquizado de la misma (siempre en un entorno diferente a los sistemas operacionales).
DATAWAREHOUSE
DEFINICION
Datawarehouse (Almacen de datos) se define como una colección de datos que verifican las siguientes propiedades:
• Está orientado (a un tema) a objetos
• Datos integrados
• No volátiles
• Variante en el tiempo
que surgieron como una herramienta de soporte para la toma de decisiones a nivel gerencial
EPICACION DE A DEFINICION
Orientado hacia temas: los datos se almacenan y agrupan por temas de interés.
Datos integrados: el almacén de datos integra datos que provienen de varias fuentes. Partimos de una base de datos (operacional) y mediante un proceso de carga de datos hacemos el Datawarehouse. El proceso de carga es lo más complicado por problemas de codificación, medidas de los atributos… de las bases de datos.
No volátiles: son estables, una vez almacenados los datos no se modifican.
Variante en el tiempo: los datos contienen información sobre la fecha de los mismos, porque se hacen cargas de datos continuamente. Cuando los datos van cambiando, se actualizan los históricos y se guardan en ficheros temporales. Siempre va haber una variable tiempo.
TIEMPO
# id_tiempo
* periodo
...