Data Warehouse
Enviado por felipe paredes • 24 de Octubre de 2022 • Resumen • 9.647 Palabras (39 Páginas) • 46 Visitas
[pic 1]
Data Warehouse: solución que ayuda a obtener respuestas para tomar decisiones.
Diseña e implementa procesos, además de herramienta para gestionar y proveer información completa.
La necesidad del DW surge por la obtención de acceso fácil a una serie de datos estructurados (ya que la información para una empresa es importante, beneficiosa y una ventaja competitiva).
Existen 3 fenómenos importantes para las organizaciones actualmente:
- El bajo costo de almacenamiento de datos.
- La relevancia de la información.
- La información se comparte.
Los sistemas DW implementan datos heterogéneos, limpios, filtrados y transformados. Estos deben ser de fácil acceso, uso y comprensión.
Los datos son utilizados para: CONSULTAR – ANALIZAR – REALIZAR INFORMES
La acumulación de información histórica en el DWH, junto a su análisis puede dar lugar a información nunca conocida acerca de los Stakeholders.
ARQUITECTURA DE DWH
Consistencia de datos: Elección de los distintos orígenes de datos, dimensiones, reglas de negocio, métrica y semántica, que una organización selecciona para uso común.
Arquitectura de almacén de datos para informes y del área de almacenamiento temporal:
- Realizar informes
- Limpieza y organización de datos
- Transferencia de almacenes de datos Existen 4 categorías de arquitecturas:
- OLPT = Sistema transaccional de operaciones
- ODS = Operational data store
- OLAP = Online analytical processing
- DM / DW Data mart / data warehouse
[pic 2]
OLPT | ODS | OLAP | DM/DW | |
Funcionalidad | Operacional | Operacional/Decisional | Decisional | Decisional/Estrategica |
Herramientas de usuario final | Cliente Servidor/WEB | C/S-WEB | C/S | C/S-WEB |
tecnologia BBDD | Relacional | Relacional | Cubica | Relacional |
Nº de transacciones | Alto | Medio | Bajo | Bajo |
Tamaño de la transacción | Bajo | Medio | Medio | Alto |
tiempo de tranascción | Corto | Medio | Medio | Alto |
Tamaño BBDD en GB | 1 | OLPT * 2 - OLPT *10 | OLPT * 2 - OLPT *10 | OLPT*2-OLPT*100 |
Modelado de datos | Entidad Relación | Entidad Relación | N/A | Dimensional |
Normalización | 3-5 NF | 3 NF | N/A | 0 NF |
OLPT | ODS | OLAP | DM/DW | |
Nº de tablas | 1-miles | 1-miles | OLPT/10 | OLPT/10 |
Media de Registros por tabla | miles -millones | miles - millones | millones | millones |
Media de tamaño por tabla (GB) | 1 a 99 | 1 a 99 | 1 a 99 | 1 a 999 |
Nº de registros de la tabla mas grande | miles - millones | miles - millones | miles - millones | miles - cientos de millones |
Tamaño de la Tabla mas grande (GB) | 1 a 99 | 1 a 99 | 1 a 99 | 1 a 999 |
Tamaño de los segmentos de Rollback | 1 a 100 Mb | 1 a 100 Mb | N/A | 1 a 999 Gb |
Tamaño de los segmentos temporales | 1 a 100 Mb | 1 a 100 Mb | N/A | 1 a 999 Gb |
- Un data warehouse es un sistema orientado a determinados “asuntos” o áreas del negocio, es también un sistema integrado, no volátil y cambiante en el tiempo, que da soporte para la toma de decisiones de los niveles ejecutivos y gerenciales de una empresa.
DATA MARTS: Son pequeños Data Warehouses que pueden trabajar independientemente o interconectados.
Su implementación es rápida y sencilla.
La cantidad de datos históricos contenidos en una data mart deben ser dictados por los requerimientos del negocio.
[pic 3]
[pic 4]
BI: habilidad de tomar mejores decisiones de manera más rápida.
- Un entorno BI enfocado al cliente provee de la infraestructura necesaria para proveer la información necesaria en base de clientes.
- La infraestructura combina datos, canales y técnicas analíticas para mejorar la satisfacción del cliente y el beneficio.
- Para los de MK es una habilidad de contactar al cliente correcto en el momento, lugar y producto correcto.
- Los canales de contacto incluyen los tradicionales, así como los basados en intercambio electrónico (email, web)
- Proveer información necesaria
- Datos obtenidos están fragmentados
CRM: administración de relación con clientes
- Conocer al cliente
- Valor del cliente
- Clientes más relevantes
- Potenciales necesidades
- Clientes/productos más rentables
[pic 5]
GRANULARIDAD: Volumen de datos que almacenara el DWH
- A mayor detalle mayor nivel de granularidad
- A menor detalle menor nivel de granularidad
Ejemplo: Registro de datos de ventas, el registro individualmente corresponde con el mayor nivel de granularidad, mientras que una consulta acerca del total de ventas del mes correspondería con un nivel de granularidad menor.
...