Business Inteligence
Enviado por Nessliver • 19 de Octubre de 2013 • 2.314 Palabras (10 Páginas) • 357 Visitas
BI
Definición:
Proceso interactivo para explorar y analizar información estructurada sobre un área para descubrir tendencias o patrones.
Se pretende convertir datos en información y con a información generar conocimiento
Áreas de BI:
• Clientes
• Proveedores
• Productos
• Servicios
• Competidores
Beneficios:
• Ayuda a toma de decisiones
• Reducir incertidumbre
Tipos de beneficios:
• Tangibles
• Intangibles
• Estratégicos
Componentes BI:
• Fuentes de información
• Proceso ETL(Extracción, Transformación y Carga)
• Data Warehouse
• Motor OLAP
• Herramientas de visualización
Fuentes de información:
• Sistemas operacionales o transaccionales
• Sistemas de información departamentales
• Fuentes de información externa
Información Estructurada.- Cuando conocemos la frecuencia y magnitud de un factor
Información no estructurada.-Cuando no se conoce cuándo ocurrirá un evento o sus características
Calidad de datos
CARACTERISTICAS:
• Precisión
• Integridad
• Coherencia
• Totalidad
• Validez
• Disponibilidad
• Accesibilidad
ETL Extract-Transform-Load
Proceso que organiza el flujo de datos entre los diferentes sistemas
Pasos del proceso:
1. Extrae datos de múltiples fuentes
2. Transforma los datos en un nuevo formato
3. Carga los datos en las estructuras de destino
DATA WAREHOUSE
Es una colección de información creada para soportar las aplicaciones de toma de decisiones
Características:
• Orientado a un área especifica
• Integrado
• Indexado
• Conjunto no volátil de información
Data Mart
Dirigidos a una comunidad de usuarios dentro de la organización (departamento, nivel organizativo, etc.)
Data mart independientes: Alimentados directamente de los orígenes de la información
Data mart dependientes: Se alimentan desde el data warehouse corporativo
Metadata.- Es el repositorio central de la información
Factores para un Data Warehouse:
• Tamaño
• Complejidad de esquemas de datos
• Numero de usuarios concurrente
• Complejidad de consultas
Se debe de asegurar:
• Alta disponibilidad
• Rendimiento
• Copias de seguridad y recuperación
• Recuperación física en caliente
CALIDAD DE LOS DATOS, CORRECCIÓN Y DETECCIÓN DE LOS ERRORES
La calidad de los datos se refiere a los procesos, técnicas, algoritmos y operaciones encaminados a mejorar la calidad de los datos existentes en empresas y organismos.
Dificultades:
• Cambios continuos y las rápidas implementaciones de sistemas
• Falta de conocimiento de la situación real
• Falta de conciencia sobre la importancia del tema
Objetivos:
• Ahorrar costos directos
• Potenciar acciones de marketing y gestión
• Mejorar capacitación y fidelización de los clientes
• Mejorar imagen corporativa
• Mejorar el servicio
Procesos detección y corrección de errores
Data Profiling.- Proceso de evaluación de los datos
• Metodología:
• Análisis de elementos
• Análisis de la estructura
• Verificación de reglas del negocio
• Análisis estadístico
Data Cleansing.- Proceso de limpieza de datos
Metodología:
• Análisis
• Transformación de datos
• Eliminación de duplicados
• Método estadístico
Detección de errores:
• Evaluación de datos
• Depuración o limpieza de datos
• Datos de negocio internos
• Correspondencia y fusión
• Ampliación
• Seguimiento/Monitorización
• Integración de los datos
• Rendimiento
• Producción
• Auditorias periódicas
• Gestión de la excepción
Aspectos críticos:
• Analizar e identificar los datos
• Calidad de los datos
• Integración de los datos
• Enriquecer los datos
• Monitorización de los datos
Beneficios:
• Datos maestros
• Datos de activos
• Datos de transacciones
• Mejora de procesos
• Reducción de costes
• Restricciones de tiempo y recursos
• Mayores radios de éxito al combinar datos
TOMA DE DESCIONES
Requisitos:
• Definir restricciones y limitaciones
• Relación costo-beneficio, especificando los rendimientos esperados
• Definir tipo de método
• Conocer los factores internos formales de la organización y los informales
• Conocer los factores externos de la organización
Clasificación de las decisiones:
• Estructuradas.- Las que se toman frecuentemente y se pueden tomar de acuerdo con políticas, procedimientos o reglas
• No estructuradas.- Son decisiones que se toman en problemas o situaciones de poca frecuencia y requieren una solución única
Diccionario de datos
En la mayoría de los sistemas del mundo real que se trabajan, los paquetes o elementos de datos, son suficientemente complejos como para que se necesite una descripción de ellos en otros términos. Elementos de datos complejos son definidos en términos de elementos de datos más simples y elementos de datos simples están definidos en términos de unidades legítimas y los valores que pueden tomar.
Existen muchos esquemas de notación comunes usados por analistas de sistemas, el mostrado aquí abajo es de los más comunes y usa símbolos simples:
= Es compuesto por
+ Y
() Opcional
{} Iteración
[] Selección entre varas opciones
** Comentario
@ Identificador
| Separa las opciones
Ejemplo:
Nombre-Completo = Titulo + Nombre + Apellido
Titulo = [Sr. | Srta. | Sra. | Dr. | Profesor]
Nombre = {carácter-valido}
Apellido = {carácter-valido}
Carácter-valido = [A-Z|a-z|0-9|'|-| | ]
El diccionario de datos guarda y organiza
...