Bases De Datos Distribuidas
Enviado por cagf • 6 de Mayo de 2013 • 14.725 Palabras (59 Páginas) • 1.318 Visitas
1. Fundamentos Bases de Datos Distribuidas
1.1. Conceptos Básicos
1.2. Objetivos Bases de Datos Distribuidas
1.3. Disciplinas Estudio Bases de Datos Distribuidas
1.4. Arquitectura Bases de Datos Distribuidas
2. Diseño de bases de datos distribuidas
2.1. Consideraciones Diseño Bases de Datos Distribuidas
2.2. Diccionario de Datos
2.3. Niveles de Transparencia
2.3.1. Transparencia de Localización
2.3.2. Transparencia de Fragmentación
2.3.3. Transparencia de Replica
2.4. Fragmentación de Datos
2.4.1. Fragmentación Horizontal
2.4.2. Fragmentación Vertical
2.4.3. Fragmentación Hibrida
2.5. Distribución de Datos
2.5.1. Algoritmos Distribución Datos No Replicados
2.5.2. Algoritmos Distribución Datos Replicados
3. Procesamiento de consultas distribuidas
3.1. Metodología Procesamiento Consultas Distribuidas
3.2. Estrategias Procesamiento Consultas Distribuidas
3.2.1. Arboles de Consultas
3.2.2. Transformaciones Equivalentes Consultas Distribuidas
3.2.3. Métodos Ejecución del Join
3.3. Optimización de Consultas Distribuidas
3.3.1. Optimización Global Consultas Distribuidas
3.3.2. Optimización Local Consultas Distribuidas
4. Manejo de transacciones
4.1. Transacciones Conceptos
4.1.1. Estructura de Transacciones
4.1.2. Ejecución Transacciones Centralizada Distribuida
4.1.3. Estructura de transacciones
4.2. Control de Concurrencia
4.2.1. Serialización de Transacciones
4.2.2. Algoritmos de Control de Concurrencia
4.2.2.1. Basados en Bloqueo.
4.2.2.2. Basados en Estampas de Tiempo
4.2.2.3. Pruebas Validación Optimistas
4.2.3. Disciplinas del Interbloqueo prevención detección eliminación y recuperación
4.3. Confiabilidad
4.3.1. Conceptos Básicos de Confiabilidad
4.3.2. Protocolos Redo Undo
4.3.3. Puntos de Verificación checkpoints
4.3.4. Protocolo 2PC de Confiabilidad Distribuida
1 Fundamentos Bases de Datos Distribuidas
1.1Conceptos Básicos
Un sistema de administración de bases de datos distribuida (DDBMS) rige el almacenamiento y procesamiento de datos lógicamente relacionados a través de un sistema de computadoras interconectadas, donde tanto los datos como las funciones de procesamiento se distribuyen entre varios sitios.
Para entender cómo y por qué el DDBMS es diferente del DBMS, es necesario examinar brevemente los cambios en el ambiente de base de datos.
Durante los años 70’s, las corporaciones ejercieron sistemas de administración de base de datos centralizados para satisfacer sus necesidades de información estructuradas. Las necesidades de información estructurada son, por lo tanto, bien atendidas por los sistemas centralizados. Básicamente, el uso de una base de datos centralizada requería que los datos corporativos se guardaran en un solo sitio central. El acceso a los datos se proporcionaba mediante terminales no inteligentes.
El método centralizado funcionaba bien para satisfacer las necesidades de información estructurada de las corporaciones, pero se quedaba corto cuando los eventos siempre en movimiento requerían tiempos de respuesta y accesos a la información más rápidos. La lenta progresión desde la solicitud de información hasta su aprobación, y desde el especialista hasta el usuario, simplemente no era útil para los tomadores de decisiones en un ambiente dinámico. Lo que se requería era un acceso rápido, no estructurado a la base de datos utilizando consultas ad hoc para generar información al momento.
Los sistemas de administración de base de datos basados en el modelo relacional, podrían crear el ambiente en el cual las necesidades de información no estructuradas serian satisfechas mediante consultas ad hoc. Los usuarios finales podrían accesar a los datos cuando lo requirieran. También existieron otros tipos de modelos como: base de datos de red o base de datos jerárquico.
Los años 80’s dieron lugar a una serie de cambios tecnológicos y sociales que afectaron el desarrollo y el diseño de las bases de datos tales como:
• Los negocios se volvieron más geográficamente descentralizados.
• La competencia se globalizo.
• Las demandas de los clientes favorecieron el estilo de administración descentralizado.
• Los rápidos cambios tecnológicos crearon computadoras de bajo costo, y un número cada vez mayor de corporaciones adoptaron las redes LAN como base para sus soluciones.
Estos factores crearon un ambiente de negocios dinámico en el cual las compañías tuvieron que responder con rapidez a las presiones competitivas y tecnológicas. Conforme las grandes unidades de negocios se reestructuraron para formar operaciones más simples, dispersas y de reacción rápida, dos requerimientos de base de datos se volvieron obvios:
• El acceso rápido a los datos se volvió crucial para la toma de decisiones dinámicas
• La descentralización de las estructuras de administración basadas en la descentralización de unidades de negocios hicieron de las bases de datos descentralizadas ubicadas en lugares múltiples y de acceso múltiple, una necesidad.
Durante los años 90’s todos los factores anteriores se vieron influenciados fuertemente por:
• La creciente aceptación de internet y, en particular la red mundial (www), como plataforma para el acceso y distribución de los datos.
• El creciente enfoque en el análisis de los datos que condujo al manejo y almacenamiento de los datos. Aunque el almacén de datos en general no es una base de datos distribuida, depende de técnicas – tales como la replicación de datos y consultas distribuidas – que facilitan la extracción e integración de sus datos.
El impacto más importante que promovió el éxito de las bases de datos distribuidas fue el uso de internet y la solución a los problemas de ancho de banda, de cualquier manera, las bases de datos distribuidas existen hoy en día.
Computación Distribuida
Los sistemas de bases de datos distribuidas son un caso particular de los sistemas de cómputo distribuido en los cuales un conjunto de elementos de procesamiento autónomos (no necesariamente homogéneos) se interconectan por una red de comunicaciones y cooperan entre ellos para realizar sus tareas asignadas. Históricamente, el cómputo distribuido se ha estudiado desde muchos
...