Presentacion - MISI - Bases De Datos - Datawarehouse
Enviado por maximilianorosse • 22 de Junio de 2014 • 6.897 Palabras (28 Páginas) • 520 Visitas
Resumen. En el ciclo de vida del desarrollo de un DW implica gestionar cambios en las necesidades de información y las herramientas para la carga, almacenamiento, transformación, consulta y análisis de datos sufren un permanente cambio, como así también el ámbito de negocios.
Estos cambios necesitan ser controlados y bien administrados, con el fin de brindar información correcta en tiempo y forma. Es por ello que contar con un adecuado marco de trabajo, sobre el cuál basarse, puede resultar crucial en el éxito de un proyecto.
A continuación, presentaremos un estudio sobre las alternativas de cómo encarar la gestión y análisis de los requerimientos para la construcción de un Data Warehouse, tomando como referencia los enfoques propuestos por Bill Inmon (data-driven) y Ralph Kimball (requirement-driven), sobre los que se efectúa una comparación y se evalúa un framework de trabajo basado en uno de ellos: DWARF.
Palabras Clave: Data Warehouse (DW), Real-Time, OLAP, Business Intelligence (BI), ETL (Extracción, Transformación y Carga) , Data Mart
1. Introducción
La complejidad de los negocios actuales ha modificado la forma de administrar de las empresas. Los gerentes empresariales no sólo necesitan saber que está sucediendo en el negocio, sino además por qué. En la fase de aplicar tecnología de la información para automatizar el procesamiento de datos, las empresas desarrollaron aplicaciones para medir con rapidez el factor “¿qué está sucediendo?”.
Ahora, en la fase de procesamiento de la información, las empresas requieren conocer el factor “¿por qué está sucediendo?”; el ambiente competitivo y el ritmo de cambio lo demandan así. Las empresas desean pasar con rapidez a la siguiente fase. “¿qué debemos hacer y cuáles son los riesgos?”.
Para contestar estas preguntas se manejan datos a nivel estratégico, para obtener un conjunto de estrategias y herramientas enfocadas a la administración y creación de conocimiento mediante el análisis de datos existentes en una organización o empresa.
Estos datos son manejados a través de los DW, los cuales poseen requerimientos específicos dependiendo de la empresa en la cual se implementen.
Los estudios muestran que el 40% todos los proyectos que incluyen DW nunca se desarrollan, y el 85% fallan al no tener claro los objetivos de negocio [1].
Es por esto que los métodos de definición y gestión de requerimientos son la influencia máxima para un proyecto de DW, y ante requerimientos cambiantes, la gestión de cambios de un DW es uno de los temas más preponderantes para obtener un DW eficiente y útil para la toma de decisiones empresariales.
En este artículo se expone una comparación entre las metodologías de diseños de DW propuestas por Inmon y Kimball, y cómo son manejados los requerimientos de software en cada una de ellas y las consideraciones que se tienen sobre éstos.
1.1. Generalidades
A pesar de que todos los DW son diferentes, hay cuatro requerimientos de DW que son comunes en casi todos: tamaño, herramientas de gestión de datos, estructura y plataforma de software. Un DW es cualquier sistema utilizado para almacenar grandes cantidades de datos en un formato que permite la extracción de datos y de desarrollo de informes. Estos cuatro requerimientos manejan todas las decisiones que rodean la instalación y el mantenimiento de un DW con éxito.
Los requerimientos de DW para las instalaciones y el hardware utilizado pueden ser muy complejos, debido a que estos requerimientos dependen de una combinación de factores conocidos y desconocidos. El mínimo de tamaño para el espacio físico siempre debe incluir el equipo actual, así como los planes para una futura expansión. El espacio real requerido para el aumento de la capacidad de almacenamiento disminuye a medida que el proceso de fabricación para los servidores mejora.
Las herramientas de gestión de datos se utilizan para mover datos dentro y fuera del DW. El tipo y la complejidad de software utilizado es un requisito fundamental DW. El mejor ajuste de software depende de la funcionalidad requerida, el usuario previsto y la complejidad de los datos solicitados desde el almacén.
Los requerimientos de DW incluyen la selección de la estructura de DW. Hay varias estructuras disponibles, y la selección depende de los datos que se añaden al DW, la complejidad de las consultas reales con los datos y la sofisticación de los usuarios. La plataforma de software es un elemento esencial de las necesidades de DW y manejar muchas de las decisiones que rodean al soporte y mantenimiento de la herramienta.
2. Trabajos relacionados
Sólo algunos enfoques han considerado el análisis de requerimientos como una tarea crucial en las primeras etapas del desarrollo del DW. En [10], se propone un método con el fin de determinar las necesidades de información de los usuarios de DW y combinar estos requerimientos con las fuentes de datos disponibles. El enfoque descripto en [9] se centra en la descripción de un proceso de obtención de requerimientos para DWs identificando las metas de los responsables de la toma de decisiones y la información requerida. Por último, en [11], los autores presentan un marco orientado a los objetivos de los modelos de requerimientos para DWs, obteniendo así un modelo conceptual de los mismos mediante el uso de un conjunto de directivas. Desafortunadamente, estos enfoques presentan un inconveniente clave: no proporcionan mecanismos formales para asegurar la trazabilidad entre el modelo de requerimiento y el modelo conceptual, que es una propiedad deseable sólo como se indica en [12]. Estos enfoques sólo proporcionan un conjunto de directivas informales para derivar un modelo conceptual de los requerimientos.
3. Definición de Requerimientos de un DW
Los requerimientos para el sistema de DW determinan qué datos deben estar disponibles, cómo están organizados, y con qué frecuencia se actualizarán. Es ventajoso para iniciar el proceso de recopilación de requerimientos con un descubrimiento comercial macro (ver – ), que es necesario identificar los procesos clave del negocio, las métricas claves para las tomas de decisiones, medidas y requerimientos. Un modelo de alto nivel tiene que ser desarrollado en la manera que representa la forma de hacer negocios [2].
El método de recolección de requerimientos comienza con el análisis de las fuentes de datos. El diseñador selecciona qué porción de los datos disponibles en las bases de datos corporativas son relevantes para la toma de decisiones. El enfoque más utilizado es el manejado por requerimientos (requirements-driven en inglés), que prioriza los requerimientos del usuario por sobre los requerimientos
...