Bases De Datos Distribuidas
Enviado por CrisWife • 13 de Septiembre de 2011 • 4.530 Palabras (19 Páginas) • 2.085 Visitas
SISTEMAS DE BASES DE DATOS DISTRIBUIDAS
INTRODUCCIÓN
El procesamiento de bases de datos distribuidas es el procesamiento de bases de datos en el cual la ejecución de transacciones y la recuperación y actualización de los datos acontece a través de dos o más computadoras independientes, por lo general separadas geográficamente. La figura 1 muestra un sistema de base de datos distribuida que involucra cuatro computadoras.
Figura 1
Arquitectura de base de datos distribuida
El sistema de administración de base de datos distribuida (DDBMS), está formado por las transacciones y los administradores de base de datos distribuidos de todas las computadoras. Tal y como se muestra, tal DDBMS es un esquema genérico que implica un conjunto de programas que operan en diversas computadoras. Estos programas pueden ser subsistemas de un producto único DDBMS, concesionado por un sólo fabricante, o también pudiera resultar una colección de programas de fuentes dispares: algunos concesionados por fabricantes, y algunos otros escritos en casa. El propósito de esta figura es ilustrar las funciones que deban atenderse en el procesamiento de bases de datos distribuidas.
Un administrador de transacciones distribuidas (DTM) es un programa que recibe so- licitudes de procesamiento de los programas de consulta o de transacciones ya su vez las traduce en acciones para los administradores de la base de datos. Una función importante del DTM es coordinar y controlar dichas acciones. Dependiendo de la naturaleza de la aplicación del DDBMS, el DTM puede ser proporcionado como parte de DDBMS o puede desarrollarse en casa por la organización que pone en práctica el sistema distribuido. En aplicaciones menos complejas, una parte de sus funciones puede ser llevada a cabo por personas, siguiendo sólo procedimientos manuales.
Un administrador de la base de datos (DBM) es un programa que procesa cierta porción de la base de datos distribuida, como es el hecho de recuperar y actualizar datos del usuario y generales, de acuerdo con comandos de acción recibidos de los DTM. El DBM puede ser un subconjunto de un producto DDBMS, o ser también un DBMS comercial no distribuido. En algunos casos, el DDBMS pudiera contener diferentes productos DBMS.
Un nodo es una computadora que ejecuta un DTM, un DBM, o inclusive ambos. Un nodo de transacción procesa un DTM, y un nodo de base de datos procesa un DBM y su base de datos': En la Figura 17-1, el Nodo W es un nodo de base de datos ejecutando DBMwY almacenando BDw. El Nodo X es tanto un nodo de transacción como de base de datos con DTMx' DBMx y BDx. De modo similar, el Nodo Y es tanto un nodo de transacción como de base de datos, pero el Nodo Z es solamente un nodo de transacción.
Los programas de consulta o de transacción se comunican con los DTM a través de solicitudes parecidas a las solicitudes de acción del DBMS. Ejemplos son SELECT EMPLOYEE WHERE E# EQ 123 o bien STORE DUE-DATE. Estas solicitudes operan sobre estructuras lógicas. El programa de consulta o de aplicación no se refiere a ninguna instancia física en particular de la estructura.
Los DTM se comunican con los DBM por medio de acciones a ejecutarse en ocurrencias específicas de datos. Por lo tanto, si la nueva ocurrencia de DUE-DA TE debe almacenarse en DBx y en DBy, el DTM traducirá la solicitud STORE DUE-DA TE en dos acciones. Una se dirigirá a DBMx para almacenar los nuevos datos, y la segunda se dirigirá a DBMy para a su vez almacenar tal información. En principio, las solicitudes y las acciones pueden también diferir en términos de su nivel de abstracción. Por ejemplo, se puede expresar una solicitud en términos de un objeto y puede ser traducida en acciones o expresada en términos de relaciones compuestas distribuidas o de archivo. A la fecha, sin embargo, no existe un DDBMS como éste.
VENTAJAS DEL PROCESAMIENTO DISTRIBUIDO
Existen cuatro ventajas del procesamiento de base de datos distribuido. La primera, puede dar como resultado un mejor rendimiento que el que se obtiene por un procesamiento centralizado. Los datos pueden colocarse cerca del punto de su utilización, de forma que el tiempo de comunicación sea más corto. Varias computadoras operando en forma simultánea pueden entregar más volumen de procesamiento que una sola computadora.
Figura 2
Un negocio distribuido geográficamente
Segundo, los datos duplicados aumentan su confiabilidad. Cuando falla una computadora, se pueden obtener los datos extraídos de otras computadoras. Los usuarios no dependen de la disponibilidad de una sola fuente para sus datos. Una tercera ventaja es que los sistemas distribuidos pueden variar su tamaño de un modo más sencillo. Se pueden agregar computadoras adicionales a la red conforme aumentan el número de usuarios y su carga de procesamiento. A menudo es más fácil y más barato agregar una nueva computadora más pequeña que actualizar una computadora única y centralizada. Después, si la carga de trabajo se reduce, el tamaño de la red también puede reducirse.
Por último, los sistemas distribuidos se pueden adecuar de una manera más sencilla a las estructuras de la organización de los usuarios. La Figura 2 muestra la organización de un fabricante distribuido geográficamente. Los gerentes generales de cada una de las plantas poseen una enorme autoridad y libertad en la operación de sus instalaciones. Si tales plantas dependieran de una computadora única centralizada, la arquitectura de sistema entraría en conflicto con la filosofía y las políticas operacionales de la empresa. Incluso en organizaciones más centralizadas, el procesamiento distribuido ofrece una mayor flexibilidad para adecuarse a la estructura organizacional, de lo que permite el procesamiento centralizado.
DESVENTAJAS DEL PROCESAMIENTO DISTRIBUIDO
Las primeras dos desventajas de las bases de datos distribuidas son las mismas que las dos primeras ventajas. Primero, el rendimiento puede ser peor para el procesamiento distribuido que para el procesamiento centralizado. Depende de la naturaleza de la carga de trabajo, la red, el DDBMS y las estrategias utilizadas de concurrencia y de falla, así como las ventajas del acceso local a los datos y de los procesadores múltiples, ya que éstos pueden ser abrumados por las tareas de coordinación y de control requeridas. Tal situación es probable cuando la carga de trabajo necesita un gran número de actualizaciones concurrentes sobre datos duplicados, y que deben estar muy distribuidos.
Segundo, el procesamiento de base de datos distribuida puede
...