Organización de Archivos
Enviado por mowsok • 5 de Julio de 2023 • Tarea • 759 Palabras (4 Páginas) • 176 Visitas
UTEC
Ciencias de la Computación
CS2702 – Base de Datos 2 Proyecto 1
Proyecto 1:
Organización de Archivos
- Logro del estudiante
Entender y aplicar los algoritmos de almacenamiento de archivos físicos y [acceso concurrente].
- Enunciado
En grupos máximo de cuatro integrantes, elegir un dominio de datos conformado por al menos dos archivos planos con datos reales (https://www.kaggle.com/datasets). Luego sobre ellos implementar dos técnicas de organización de archivos con sus principales operaciones: inserción, eliminación y búsqueda.
- Requerimientos generales
- Implementar dos de las siguientes técnicas de organización de archivos en memoria secundaria.
- Sequential File
- AVL File.
- ISAM-Sparse Index.
- Extendible Hashing.
- B+ Tree.
- Escoger uno entre Sequential File, AVL File y el ISAM, y otro entre el Extendible Hash y el B+Tree.
- Operaciones que se deben implementar:
- La búsqueda específica puede retornar mas de un elemento que coincide con la key
vector<Registro> search(T key)
- La búsqueda por rango retorna todos los registros que calzan entre dos llaves de búsqueda
vector<Registro> rangeSearch(T begin-key, T end-key)
- Agregar un registro al archivo respetando la técnica de organización
bool add(Registro registro)
- Proponer un algoritmo de eliminación para cada técnica
bool remove(T key)
- Simular un planificador de transacciones concurrentes con las operaciones de lectura y escritura.
- Mostrar los resultados de forma amigable a usuario. Ver la siguiente GUI de referencia.
[pic 1]
- Consideraciones de la implementación
- En el Sequential Index La función add(Registro registro) debe utilizar un espacio auxiliar para guardar los nuevos registros. Cuando el espacio auxiliar llegue a K registros, aplique un algoritmo de reconstrucción del archivo de datos manteniendo el orden físico de acuerdo a la llave seleccionada. Asegúrese de mantener los punteros actualizados.
- En el ISAM partir construyendo el índice estático hasta de 3 niveles a partir de un conjunto de datos. Para nuevas inserciones se generan los overflow pages (encadenamiento de páginas).
- En el ISAM de debe definir el factor de bloque tanto en las páginas de datos como en las páginas del índice.
- La función rangeSearch debe usar el índice para buscar el begin-key y luego recorrer los registros de acuerdo la estructura del índice. Esta función no es soportada por las técnicas hashing.
- Usar los conceptos de programación orientado a objetos y programación genérica.
- Para la interfaz gráfica pueden usar QT, Visual Studio, wxWidgets u otra librería gráfica.
- Informe del proyecto
- Archivo en Markdown / Wiki.
- Ortografía y consistencia en los párrafos.
- Al final del informe poner el video explicando el funcionamiento del programa, casos de uso, aspectos importantes de la implementación. El video no debe exceder los 10 minutos y deben participar todos los integrantes del grupo.
- Aspectos de evaluación e informe:
Item | Descripción |
(2 pts) |
|
(8 pts) |
|
(6 pts) |
|
(4 pts) |
|
- Entregable
- Los alumnos formarán grupos de máximo cuatro integrantes.
- El código fuente del proyecto será alojado en GitHub Classroom.
- En el Canvas subir solo el enlace público del proyecto.
- La fecha límite de entrega es el --------.
...