Crear esquemas multidimensionales para representar el modelo lógico de almacenes de datos
Enviado por Andrés Valle • 4 de Junio de 2017 • Documentos de Investigación • 1.354 Palabras (6 Páginas) • 259 Visitas
Semana: 10
Tema 3: Carga y explotación de almacenes de datos
Laboratorio #9: Diseño de estructuras multidimensionales.
Objetivo: Crear esquemas multidimensionales para representar el modelo lógico de almacenes de datos
Contenido:
∙ Introducción a los cubos OLAP.
∙ Configuración de la conexión a base de datos.
∙ Diseño de esquemas OLAP.
Desarrollo
“... Schema Workbench es la interfaz de diseño que permite crear y probar los esquemas OLAP de Mondrian de manera visual” [Julian Hyde, 2011]
Cubos OLAP
Durante el curso han definido previamente los conceptos de almacén de datos y mercado de datos aprovechando las tecnologías de bases de datos relacionales (Ver temas anteriores). Frecuentemente se utiliza otro tipo de almacenamiento para los mercados de datos que es OLAP (OnLine Analytical Processing). La idea de las bases de datos OLAP es usar un formato de almacenamiento optimizado para brindar al usuario flexibilidad y acceso muy rápido. La rapidez está dada porque muchos totales y subtotales se almacenan en el cubo OLAP. Aunque un cubo de este tipo puede tener más de tres dimensiones a menudo es visualizado como un cubo Rubik, de ahí el nombre de cubo.
[pic 5]
Un componente fundamental entre el almacén de datos y las aplicaciones del cliente para realizar análisis OLAP es un esquema, que esencialmente es un documento XML que describe uno o más cubos multidimensionales. El esquema describe las relación entre las dimensiones y medidas del cubo con las tablas y columnas de la base de datos relacional.
Una de las herramientas que se pueden emplear para crear esquemas es Pentaho Schema Workbench. También puede usar un editor de texto.
Usando Pentaho Schema Workbench
Esta herramienta como muchas de la parte comunitaria de la suite Pentaho se distribuye en un archivo compactado. Luego de descompactado se crea la carpeta de la aplicación con el nombre “schema-workbench”, para la que se debe copiar el driver JDBC, en este caso de la base de datos PostgreSQL que será la empleada; este último archivo debe tener un nombre similar a “postgresql-9.1-902.jdbc4.jar”. Para iniciarlo, ejecutamos workbench.sh o workbench.bat para Linux y Windows respectivamente. Inmediatamente debe configurarse la base de datos usando el menú Options | Connection.... En la lista Connection Type se selecciona PostgreSQL; en el panel Settings se establecen las propiedades de conexión a base de datos. El botón Test permitirá comprobar que la base de datos se ha conectado con el PSW.
Nota: En esta guía se utiliza una base de datos del Mercado de datos Medio Ambiente de la ONEI. Contiene
2 esquemas y 75 tablas. El script SQL para crear la base datos y su contenido se adjunta. Cree primero una base de datos con el nombre medio_ambiente y ejecute luego el script para esa base de datos.[pic 6]
Las opciones de conexión son las siguientes. Host Name: localhost
Database Name: medio_ambiente
Port Number: 5432
User Name: postgres
Password: postgres
Una vez definida la conexión cree un nuevo esquema y guárdelo con el nombre medio_ambiente.xml.
[pic 7]
1: Vista principal de Pentaho Schema Workbench
La interfaz consta de un menú superior, una barra de herramientas principal y una ventana interna para cada esquema que se edita. La ventana de edición a su vez se compone de una barra de herramientas con las opciones para crear cada elemento del esquema, un árbol de navegación del esquema, una tabla de propiedades del elemento seleccionado en el árbol y una barra de estado, donde se puede comprobar si hay definida una base de datos para crear el modelo dimensional.
Ejercicio 1. Creando el primer esquema dimensional.
Para este primer esquema se usará de la base de datos medio_ambiente la tabla de hecho mart_medio_ambiente.hech_acueducto_alcantarillado, que está relacionada con dimensiones.dim_temporal_anno y mart_medio_ambiente.dim_acueducto_alcantarillado.
La imagen 2 muestra la estructura de estas tablas.
[pic 8]
2: Estructura de las tablas relacionadas con el hecho hech_acueducto_alcantarillado
1. Las tareas a realizar serán las siguientes:
∙ Creación del esquema
∙ Creación de los cubos
∙ Selección de la tabla de hechos
∙ Adicionar medidas
∙ Creación de dimensiones
∙ Edición de la jerarquía por defecto y selección de la tabla de dimensión
∙ Definición de los niveles de la jerarquía
∙ Asociar dimensiones con cubos
2. Para crear un cubo de clic derecho sobre el esquema y seleccione Add cube.
3. Para definir la tabla del hecho de clic derecho sobre el cubo y seleccione Add Table. Seleccione o escriba el nombre del esquema y la tabla (hech_acueducto_alcantarillado). Ponga el nombre en las propiedades del cubo igual que el nombre tabla de hechos.
...