Cubos De Información
Enviado por karen0506 • 11 de Febrero de 2013 • 2.033 Palabras (9 Páginas) • 284 Visitas
Introducción al Análisis de Datos
Introducción
• La sociedad de la información e Internet han generado
una explosión de datos
– No hay suficiente gente que pueda analizar tal cantidad de
datos
– Potencia de computación disponible
– El desarrollo de software es un cuello de botella
•Extraer conocimiento a través de ejemplos es atractivo
– Aprendizaje de la experiencia para tomar decisiones
– Servicios comerciales, financieros, etc. tienden hacia la
personalización: adaptación al individuo
• Es muy importante la comprensibilidad de la salida
Introducción al Análisis de Datos
• Descubrimiento de patrones, relaciones y tendencias
mediante análisis de gran cantidad de datos
Extracción de conocimiento
Bases de
datos
Visualización
Estadística
Aprendizaje
automático
Extracción de
conocimiento
Introducción al Análisis de Datos
Ejemplos de aplicaciones
• Toma de decisiones
– Cuándo concedo un crédito hipotecario? por cuánto? Qué
tipo de solicitante no devolverá el crédito?
– Un cliente de tarjeta de crédito está realizando una compra,
pagará? se la han robado?
• Diagnósticos
– Determinación de enfermedades
– Fallos en procesos industriales
• Marketing y ventas
– Hábitos y fidelidad de clientes. Cuál es el perfil de los clientes
que se gastan al mes más de 100.000 pts?
– Análisis de compras. Qué productos de nuestra empresa es
el que compran los clientes junto al detergente?
– Análisis de perfil más adecuado para publicidad directa.
Introducción al Análisis de Datos
Ejemplos de aplicaciones
• Predicción
– Cuánta energía se va a consumir en los próximos días?
• Agencia tributaria
– Cuál es el perfil de los “defraudadores"?
– Se puede subdividir en grupos homogéneos y caracterizar
los diferentes tipos de contribuyentes?
– Cuáles están más alejados de cada grupo?
• Herramienta de investigación. Ej.: imágenes:
– Dada una imagen tomada por un telescopio, soy capaz de
detectar y clasificar objetos interesantes?
– Alerta de fuegos, fugas de combustible, militares, etc.?
• Mejora de procesos industriales
• ...
Introducción al Análisis de Datos
Análisis de datos en Internet
• Web Mining: análisis de páginas para extraer
automáticamente información
• e-Mining: análisis de las interacciones de los clientes
con mis páginas
• Web para extraer información
• Tipo de información que busco:
– Qué tipo de clientes tengo
– Cómo interacciona cada tipo de cliente con las páginas Web
– Qué banners son los que siguen mis clientes (publicidad)
– Descubrimiento de patrones de compra/navegación
• Herramientas de gestión automática del correo
Introducción al Análisis de Datos
Almacén de datos (data warehouse)
• Técnicas para almacenar y manejar datos provenientes
de varias fuentes de una organización como medio de
soporte a la decisión
Datos
Almacén
Interfaz
Extracción del
conocimiento
Introducción al Análisis de Datos
Data Warehouse
Almacén
de Datos
Cualquier
acceso
Fuentes
Heterogéneas
Datos Aplicaciónes
externos
Datos de
Negocio
Herramientas
Cliente/Servidor
Extracción/Filtro/Integración
Explotación
Data
Warehouse
Web
Browser
Introducción al Análisis de Datos
Data Warehouse y Data Marts
C/S
Users
Web
Internet o
Intranet
Data Mart 1
Data Mart n
C/S
Users
Web
Internet
o Intranet
Explotación
Datos
externos
Extracción/Filtro/Integración
Explotación
Data
Warehouse
Datos de
Negocio
Explotación
Introducción al Análisis de Datos
Un “cubo” es una estructura para almacenar información
que permite realizar análisis multidimensional y se basa
en métricas y dimensiones.
¿Qué es un CUBO de información?
Métrica: Medición matemática de una variable del negocio.
Qué quiero medir.
• cantidad de ventas
• unidades vendidas
• % desecho
• # productos en
almacén
• etc.
Introducción al Análisis de Datos
Dimensión. Contra qué quiero medir.
• sucursales
• zona
• clientes
• vendedores
•etc.
Un “cubo” es una estructura para almacenar información
que permite realizar análisis multidimensional y se basa
en métricas y dimensiones.
¿Qué es un CUBO de información?
Introducción al Análisis de Datos
Ventas
México
Norte Centro Sur
D.F. Morelos
BJ VC XO
Balbuena Moctezuma
Drill Down. Desglosar una métrica de lo general a lo particular
por la jerarquía de sus dimensiones
Operaciones con cubos OLAP
Introducción al Análisis de Datos
Ventas
México
Norte Centro Sur
D.F. Morelos
BJ VC XO
Balbuena Moctezuma
Drill Up. Agregar una métrica de lo particular a lo general por
la jerarquía ascendente de sus dimensiones
Operaciones con cubos OLAP
Introducción al Análisis de Datos
Slice. Obtener un sub-cubo fijando una de sus dimensiones
Tiempo= Ene.
Norte
Este
Sur
A B C
Geografía
Ventas del
Producto
Operaciones con cubos OLAP
Introducción al Análisis de Datos
Dice. Obtener un sub-cubo fijando dos o mas de sus dimensiones
Tiempo = Ene. or Feb
Geografía =Norte or Este
Obtenemos un cubo2 x 3
Tiempo = Ene. or Feb
Geografía =Norte or Este
Ventas del Producto = C or B
Obtenemos un cubo 2 x 2
Operaciones con cubos OLAP
Introducción al Análisis de Datos
El Proceso de KDD
Conocimiento
LIMPIEZA
Datos Procesados
TRANSFORMACIÓN
...