Datawarehouse
Enviado por ADDA_RAGO02 • 12 de Marzo de 2015 • 3.503 Palabras (15 Páginas) • 159 Visitas
1.4 ESTRUCTURA DEL DATA WAREHOUSE
________________________________________
Los data warehouses tienen una estructura distinta. Hay niveles diferentes de esquematización y detalle que delimitan el data warehouse. La estructura de un data warehouse se muestra en la Figura N° 5.
En la figura, se muestran los diferentes componentes del data warehouse y son:
o Detalle de datos actuales
o Detalle de datos antiguos
o Datos ligeramente resumidos
o Datos completamente resumidos
o Meta data
o Detalle de datos actuales.- En gran parte, el interés más importante radica en el detalle de los datos actuales, debido a que:
o Refleja las ocurrencias más recientes, las cuales son de gran interés
o Es voluminoso, ya que se almacena al más bajo nivel de granularidad.
o Casi siempre se almacena en disco, el cual es de fácil acceso, aunque su administración sea costosa y compleja.
o Detalle de datos antiguos.- La data antigua es aquella que se almacena sobre alguna forma de almacenamiento masivo. No es frecuentemente accesada y se almacena a un nivel de detalle, consistente con los datos detallados actuales. Mientras no sea prioritario el almacenamiento en un medio de almacenaje alterno, a causa del gran volumen de datos unido al acceso no frecuente de los mismos, es poco usual utilizar el disco como medio de almacenamiento.
o Datos ligeramente resumidos.- La data ligeramente resumida es aquella que proviene desde un bajo nivel de detalle encontrado al nivel de detalle actual. Este nivel del data warehouse casi siempre se almacena en disco. Los puntos en los que se basa el diseñador para construirlo son:
o Que la unidad de tiempo se encuentre sobre la esquematización hecha.
o Qué contenidos (atributos) tendrá la data ligeramente resumida.
o Datos completamente resumidos.- El siguiente nivel de datos encontrado en el data warehouse es el de los datos completamente resumidos. Estos datos son compactos y fácilmente accesibles.
A veces se encuentra en el ambiente de data warehouse y en otros, fuera del límite de la tecnología que ampara al data warehouse. (De todos modos, los datos completamente resumidos son parte del data warehouse sin considerar donde se alojan los datos físicamente.)
o Metadata.- El componente final del data warehouse es el de la metadata. De muchas maneras la metadata se sitúa en una dimensión diferente al de otros datos del data warehouse, debido a que su contenido no es tomado directamente desde el ambiente operacional.
La metadata juega un rol especial y muy importante en el data warehouse y es usada como:
o Un directorio para ayudar al analista a ubicar los contenidos del data warehouse.
o Una guía para el mapping de datos de cómo se transforma, del ambiente operacional al de data warehouse.
o Una guía de los algoritmos usados para la esquematización entre el detalle de datos actual, con los datos ligeramente resumidos y éstos, con los datos completamente resumidos, etc.
La metadata juega un papel mucho más importante en un ambiente data warehousing que en un operacional clásico.
A fin de recordar los diferentes niveles de los datos encontrados en el data warehouse, considere el ejemplo mostrado en la Figura N° 6.
El detalle de ventas antiguas son las que se encuentran antes de 1992. Todos los detalles de ventas desde 1982 (o cuando el diseñador inició la colección de los archivos) son almacenados en el nivel de detalle de datos más antiguo.
El detalle actual contiene información desde 1992 a 1993 (suponiendo que 1993 es el año actual). En general, el detalle de ventas no se ubica en el nivel de detalle actual hasta que haya pasado, por lo menos, veinticuatro horas desde que la información de ventas llegue a estar disponible en el ambiente operacional.
En otras palabras, habría un retraso de tiempo de por lo menos veinticuatro horas, entre el tiempo en que en el ambien¬te operacional se haya hecho un nuevo ingreso de la venta y el momento cuando la información de la venta haya ingresado al data warehouse.
El detalle de las ventas son resumidas semanalmente por línea de subproducto y por región, para producir un almacenamiento de datos ligeramente resumidos.
El detalle de ventas semanal es adicionalmente resumido en forma mensual, según una gama de líneas, para producir los datos completamente resumidos.
La metadata contiene (al menos):
o La estructura de los datos
o Los algoritmos usados para la esquematización
o El mapping desde el ambiente operacional al data warehouse
La información adicional que no se esquematiza es almacenada en el data warehouse. En muchas ocasiones, allí se hará el análisis y se producirá un tipo u otro de resumen. El único tipo de esquematización que se almacena permanentemente en el data warehouse, es el de los datos que son usados frecuentemente. En otras palabras, si un analista produce un resumen que tiene una probabilidad muy baja de ser usado nuevamente, entonces la esquematización no es almacenada en el data warehouse.
METADATA
Los metadatos son datos que describen otros datos. Meta es un prefijo que en la mayoría de los usos de tecnología de información significa "una definición o descripción subyacente."
Metadatos resume la información básica acerca de los datos, que pueden hacer para encontrar y trabajar con casos particulares de datos más fácil. Por ejemplo, autor, fecha de creación y fecha de modificación y tamaño de archivo son ejemplos de metadatos muy básico documento. Tener la abilty se filtre a través de metadatos que hace que sea mucho más fácil para alguien para localizar un documento específico.
Además de los archivos de documentos, los metadatos se utiliza para las imágenes, videos, hojas de cálculo y páginas web. El uso de metadatos en las páginas web puede ser muy importante. Metadatos para páginas web contiene descripciones de los contenidos de la página, así como palabras clave vinculados con el contenido. Estos se expresan normalmente en forma de metatags . Los metadatos que contiene la descripción de la página web y el resumen es a menudo aparece en los resultados de búsqueda por los motores de búsqueda, por lo que su precisión y detalles muy importante ya que puede determinar si un usuario decide visitar el sitio o no. Metatags a menudo son evaluados por los motores de búsqueda para ayudar a decidir la relevancia de una página web, y se utilizaron como el factor clave en la determinación de la posición en una búsqueda hasta finales de 1990. El aumento de la optimización de motores de búsqueda ( SEO ) hacia el final de la década de 1990 llevó
...