Datawarehouse
Enviado por lolee • 30 de Noviembre de 2012 • 2.159 Palabras (9 Páginas) • 423 Visitas
Data Warehouse
¿Qué es Data Warehousing?
En la actualidad hay una importante cantidad de confusión respecto a lo que es un Data Warehouse que, afortunadamente, está comenzando a despejarse. No obstante, parece que cada proveedor de un producto o servicio relacionado con tecnología informática tiene su definición y, lo que es peor, en su propia jerga no siempre comprensible.
Algunos llaman a Datawahouse Business Intelligence or Decision Support en realidad es considerada la solución integral y oportuna para desarrollar negocio el Datawarehouse se caracteriza por ser:
Integrado - Temático - Histórico - No volatil
Definición :
Es un proceso, no un producto. Es una técnica para consolidar y administrar datos de variadas fuentes con el propósito de responder preguntas de negocios y tomar decisiones, de una forma que no era posible hasta ahora.
Consolidar datos desde una variedad de fuentes. Dentro del marco conceptual de Data Warehousing los agruparemos dentro del proceso de Transformación de Datos.
Manejar grandes volúmenes de datos de una forma que no era posible, o no era costo efectiva. A estos medios los agruparemos en Procesamiento y Administración de Datos.
Acceder a los datos de una forma más directa, en "el lenguaje del negocio", y analizarlos para obtener relaciones complejas entre los mismos. Estos procesos se engloban en dos categorías que serán explicadas más adelante: Acceso a los Datos y Descubrimiento o Data Mining.
Estos desarrollos tecnológicos, correctamente organizados e interrelacionados, constituyen lo que se ha dado en llamar un Data Warehouse
o Bodega de Datos. Veamos un poco más en detalle los grupos mencionados.
Existen muchas definiciones para el DW, la más conocida fue propuesta por Inmon[MicroSt96] (considerado el padre de las Bases de Datos) en 1992: "Un DW es una colección de datos orientados a temas, integrados, no-volátiles y variante en el tiempo, organizados para soportar necesidades empresariales". En 1993, Susan Osterfeldt[MicroSt96] publica una definición que sin duda acierta en la clave del DW: "Yo considero al DW como algo que provee dos beneficios empresariales reales: Integración y Acceso de datos. DW elimina una gran cantidad de datos inútiles y no deseados, como también el procesamiento desde el ambiente operacional clásico".
Data Mining
En este sentido un sistema Datamining es una tecnología de soporte para usuario final, cuyo objetivo es extraer conocimiento útil y utilizable a partir de la información contenida en las bases de datos de las empresas.
Los objetivos de un sistema Datamining nos permitiría analizar factores de influencia en determinados procesos, predecir o estimar variables o comportamientos futuros, sementar o agrupar ítems similares, además de obtener secuencias de eventos que provocan comportamientos específicos.
Los sistemas Datamining se desarrollan bajo lenguajes de ultima generación basados en la inteligencia artificial y utilizando métodos matemáticos, tales como:
• Redes euronales
• Introducción de reglas
• Arboles de decisión
• Conjunto de reglas por clase
Soporta tambien sofisticadas operaciones de análisis tales como los sistemas Scoring
y aplicaciones de detección de fraude.
Data Marts.
Es un pequeños Data Warehouse, para un determinado numero de usuarios, para un arrea funcional, especifica de la compañía. También podemos definir que un Data Martes es un subconjunto de una bodega de datos para un propósito especifico.
Su función es apoyar a otros sistemas para la toma de decisiones.
Los procesos que conforma el datawarehouse son:
1-Extraccion
2-Elaboración
3-Carga
4-Explotacion
[pic]
Componentes del Data Warehouse Impactos DW
El éxito de DW no está en su construcción, sino en usarlo para mejorar procesos empresariales, operaciones y decisiones. Posesionar un DW para que sea usado efectivamente, requiere entender los impactos de implementación en los siguientes ámbitos:
Diagrama de Funcionamiento
[pic]
¿Cómo trabaja el Data Warehouse?
• Extrae la información operacional.
• Transforma la operación a formatos consistentes.
• Automatiza las tareas de la información para prepararla a un análisis eficiente.
¿En quê podemos usarlo?
• Manejo de relaciones de marketing.
• Análisis de rentabilidad.
• Reducción de costos.
Busines Intelligence se ha vuelto una necesidad en el vertiginoso ritmo del ambiente de negocios actual. Los negocios necesitan aprovechar las posibilidades que les ofrece la actual tecnología para permanecer competitivos y rentables.
OLAP
Es un sinónimo de base de datos multidimensional mediante las cuales se proveen una tecnología para el cálculo y análisis requerido por las aplicaciones analíticas para el "Bussines Intellingence", las bases
de datos relacionadas están formadas por un conjunto de registros. Cada registro contiene la información organizada en campos.
El OLAP describe la tecnología asociada al acceso y análisis de datos en líneas.
Sistemas De Data Warehouse Y Oltp
Una base de datos para soportar procesos transaccionales en línea (OLTP), puede no ser adecuada para el Data Warehouse ya que ha sido diseñada para maximizar la capacidad transaccional de sus datos y tipicamente tiene cientos de tablas la gran mayoría normalizadas. Su diseño también ha sido condicionado por los procesos operacionales que deberá soportar para la óptima actualización de sus datos, normalmente muchas de sus tablas en constantes y continuos cambios. Los sistemas Data Warehouse están orientados a procesos de consultas en contraposición con los procesos transaccionales.
OLTPData Warehouse Propósito Ejecuta operaciones transaccionales diariamente Consultas y análisis para la obtención de información Estructura Sistemas de bases de datos relacionales Normalmente sistemas de bases de datos relacionalesModelo de datos Normalizado Muchas de sus tablas pueden no estar normalizadas se admite redundancia en los datos. Bases de datos multidimensionales.Acceso SQL SQL más extensiones especiales dependientes de las herramientas de explotación de datos (Data Mining)
No obstante, el SQL estándar puede ser suficiente en manos de personal experto.Tipo de datosLos datos están orientados a la gestión de los negociosLos datos están orientados al análisis de los negocios.
Transforman los datos en información para su análisis. Perdurabilidad
Los datos cambian constantemente,
...