Base de datos distribuidas. Una base de datos distribuida permite que los datos residan en ubicaciones físicas diferentes
Enviado por isabelml • 16 de Octubre de 2017 • Apuntes • 2.422 Palabras (10 Páginas) • 231 Visitas
Bases de datos distribuidas
Algunas veces, el hecho de mover los datos de una ubicación a otra no es suficiente. Cuando se tiene la necesidad de que los datos estén almacenados en diferentes ubicaciones dentro de la organización, entonces es necesario implementar una “base de datos distribuida”.
Una base de datos distribuida permite que los datos residan en ubicaciones físicas diferentes, en diferentes bases de datos, posiblemente con software de sistemas de administración de bases de datos (DBMS) y sistemas operativos diferentes. Consideremos, por ejemplo, una organización que usa un canal de ventas que implementa una base de datos distribuida. Cada canal de ventas tendría una base de datos y la oficina matriz una base de datos central. Con tecnología de redes y las facilidades de una base de datos distribuida del DBMS se podría acceder y modificar los datos en cualquier ubicación, desde cualquier ubicación. Además, podríamos especificar que ubicaciones tendrían permisos de actualizar o acceder a ciertas bases de datos.
En resumen, la ubicación de los datos en un ambiente de redes requiere el análisis de muchas consideraciones de diseño para acelerar el tiempo de acceso, alta integridad y fácil mantenimiento. La premisa básica de la tecnología de bases de datos distribuidas es ofrecer un acceso uniforme a los datos que están relacionados de manera lógica, pero distribuidos de manera física en múltiples ubicaciones. Existen muchos tipos y variaciones de la forma en que se implementan las bases de datos distribuidas.
El grado de distribución de las bases de datos que se puede lograr se define por la capacidad de DBMS en uso. Las características siguientes de un ambiente distribuido difieren en los DBMSs existentes:
Autonomía. Representa el grado en el cual los “sites” pueden operar de manera independiente dentro de una implementación de bases de datos distribuidas. Existe un nivel intermedio de autonomía cuando un site puede compartir sus datos de manera voluntaria. En contraste, un fuerte acoplamiento indica un alto nivel de autonomía porque cada site en un ambiente distribuido tiene un completo conocimiento del estado del sistema y puede controlar el procesamiento de los requerimientos de usuario que propagan los datos a múltiples sites.
Aislamiento. Define si cada site sabe de la existencia de otros sites en el ambiente distribuido o si cada site es un servidor único, es decir ignora la existencia de otros sites.
Transparencia. Se refiere a la protección de la ubicación de los datos para usuarios y aplicaciones.
Cada DBMS proporciona la funcionalidad para implementar bases de datos con diferentes grados de autonomía, asilamiento y transparencia. Para establecer un ambiente efectivo de bases de datos distribuidas, el DBA debe entender profundamente las capacidades del DBMS, además de proporcionar los lineamientos a los desarrolladores de aplicaciones. En un sistema con transparencia, los desarrolladores necesitan saber la ubicación de los datos; típicamente, la programación distribuida requiere que el programador codifique el código de conexión de manera explícita hacia la ubicación del servidor de bases de datos, antes de acceder a los datos de esa ubicación.
Una base de datos distribuida se puede implementar como una base de datos única o como múltiples bases de datos. Con una implementación única, un solo DBMS controla el proceso de acceso a los datos; en cambio, una implementación de múltiples bases de datos, proporciona múltiples procesos de DBMSs, cada uno controlando el acceso a su propia base de datos local.
Una base de datos múltiple puede ser: Federal o no federal (confederada). Una implementación de base de datos federal establece un control entre las bases de datos distribuidas. El DBA puede controlar cada componente de la base de datos local de la federación para determinar qué datos se almacenan ahí y quien puede acceder a ellos. Un esquema de base de datos múltiple no federal centraliza el control de estos mecanismos. Comúnmente, las implementaciones de bases de datos no federales (o confederadas) son homogéneas, mientras que las bases de datos múltiples federales son heterogéneas.
Implementación de un ambiente distribuido
Un DBMS distribuido permite que los datos sean colocados físicamente en más de un DBMS y en más de una ubicación. Los datos que son realmente distribuidos pueden residir en servidores de bases de datos así como en nodos de clientes. Entre más distribuidos estén los datos y más cerca se encuentren éstos del usuario, mejor será el rendimiento. Sin embargo, debido a que los datos están distribuidos en más ubicaciones físicas se hace más complejo de manipular y administrar. Desde una perspectiva de mantenimiento, la administración que se requiere para varios DBMSs de escritorio es muy difícil. Una implementación de una base de datos distribuida en la vida real, consistirá en datos que residen en múltiples servidores ubicados en diferentes sites; y en algunas ocasiones también en nodos de clientes.
Desde la perspectiva del DBA, algunos de los aspectos más difíciles en la implementación de bases de datos distribuidas se encuentran en el diseño y la instalación. La primera tarea del DBA consiste en entender las capacidades de distribución del DBMS. ¿Puede usarse como un sistema federal o confederado? ¿Qué software adicional se requiere para soportar bases de datos distribuidas? ¿Qué tipos de protocolos de red se necesitan?
El DBA necesitará trabajar con los administradores de red para asegurarse que las redes de la compañía estén bien configuradas para soportar bases de datos distribuidas. El DBMS requerirá el establecimiento de parámetros de configuración para habilitar la distribución e identificar las ubicaciones de la red para las bases de datos remotas.
Como ejemplo de una base de datos distribuida, supongamos que los datos residen en Monterrey (México) y en Sydney (Australia). ¿Cómo decide el DBA qué datos deben almacenarse Monterrey y qué datos deben almacenarse en Sydney? ¿De qué manera el DBA puede determinar y configurar la base de datos de tal modo que los usuarios puedan acceder a los datos requeridos sin importar su ubicación?
Definitivamente, no existe una regla rápida y segura que conteste estas preguntas. Hay muchos caminos que pueden seguirse. Primero, los datos deben residir en el servidor en el que sea más probable que se acceda a ellos. El DBA debe analizar el uso planeado que se le dará a los datos con el objeto de optimizar el rendimiento de la aplicación, reduciendo los costos de transmisión. Por ejemplo, los datos más usados en Monterrey deben residir en el servidor de Monterrey y de igual manera, con Sydney.
...