Consultas SQL avanzadas, con el uso de funciones analíticas en un Data Warehouse predefinido
Enviado por María Alejandra Quitian • 25 de Octubre de 2022 • Tutorial • 778 Palabras (4 Páginas) • 74 Visitas
PROGRAMA INGENIERÍA DE SISTEMAS
(NUEVO PLAN DE ESTUDIOS)
GUIA DE LABORATORIO
CURSO: Bases de datos masivas AREA: Arquitectura de datos
Nro. DE LA PRÁCTICA: 1 H. PRESENCIALES: 2 H. INDIVIDUALES: 2 NOMBRE DE LA PRÁCTICA: Análisis de datos para la toma de decisiones
PROYECTO AL QUE PERTENECE: Exploración de las herramientas de Big Data para analítica de datos.
TEMÁTICAS: Consultas SQL avanzadas, con el uso de funciones analíticas en un Data Warehouse predefinido.
COMPETENCIAS PARA DESARROLLAR: Diseñar, implementar y gestionar soluciones informáticas acorde a las tendencias tecnológicas para solucionar problemas y necesidades propias de su contexto social.
CONOCIMIENTOS PREVIOS REQUERIDOS: Creación de consultas SQL avanzadas, funciones analíticas y estadística básica.
RECURSOS: Máquina virtual “training” de Cloudera para data analytics, herramienta de trabajo gráfico HUE, Gestor de bases de datos IMPALA/HIVE, base de datos Fly.
DESCRIPCIÓN DE LA PRÁCTICA
Objetivo:
El objetivo de la actividad es recomendar qué par de aeropuertos de los Estados Unidos deben estar conectados con un túnel ferroviario de pasajeros de alta velocidad. Para esto deberá escribir una declaración SQL que cumpla con todos los requisitos enumerados, y que devuelva los detalles requeridos, para luego analizar su resultado y hacer una recomendación para la toma de la decisión.
Planteamiento situación de análisis:
Usted es un analista de datos de una empresa que planea revolucionar el transporte masivo de pasajeros mediante la construcción de un túnel ferroviario de alta velocidad. Y se necesita decidir cuáles podrían ser los dos principales aeropuertos de Estados Unidos que saldría más rentable conectar mediante este túnel. Estos dos aeropuertos deben estar entre 300 y 400 millas de distancia, y deben tener un promedio de al menos 5,000 vuelos por año entre ellos, en cada dirección. Por último, los aeropuertos deben tener un gran volumen de viajeros volando entre ellos en ambas direcciones, la compañía cree que se puede persuadir a estos viajeros aéreos para que se cambien al tren de alta velocidad debido a los frustrantes retrasos en los vuelos.
Sugerencias para el desarrollo de la actividad:
∙ La tabla vuelos tiene una columna denominada distancia que indica la distancia en millas de cada vuelo. Utilice los valores de esta columna para determinar las distancias entre aeropuertos.
∙ La tabla de aviones contiene diez años de datos de vuelos, por lo que, para obtener los totales medios anuales, deberá dividir los totales de la tabla completa por diez. ∙ La tabla de aviones tiene una columna denominada asientos que indica el número de asientos en cada avión, para poder determinar el volumen de pasajeros. ∙ Las dos primeras filas del resultado de su consulta deben mostrar su ruta de túnel recomendada. Estas dos filas superiores deben mostrar el mismo par de aeropuertos, pero con el origen y el destino cambiados.
...