Bases de datos distribuidas
Enviado por Luisa Fernanda Laverde Sarmiento • 3 de Noviembre de 2021 • Documentos de Investigación • 1.878 Palabras (8 Páginas) • 84 Visitas
[pic 1]
BASES DE DATOS DISTRIBUIDAS
Luisa Fernanda Laverde Sarmiento
[pic 2][pic 3]
Contenido
Introducción 1
Bases de datos distribuidas 2
Conclusiones 5
Introducción
Al estudiar el tema de la base de datos distribuida (BDD), debe prestar atención a dos elementos básicos: la base de datos y el sistema informático distribuido en una red informática. Una base de datos es un conjunto que está vinculado en un sentido inherente y creado para un propósito específico. Por su parte, un sistema distribuido conecta lugares donde se ubican diversos elementos informáticos para recolectar, almacenar, procesar y enviar datos a otros sistemas. En adelante, BDD se puede definir como un conjunto de varias bases de datos interconectadas lógicamente (llamadas locales) distribuidas a través de una red informática. Se puede decir que fue una combinación de un sistema de base de datos y un sistema de red de computadoras, que fue posible gracias al desarrollo de las telecomunicaciones.
Su proceso principal es almacenar datos en muchas computadoras diferentes, que se comunican a través de diferentes medios, como teléfonos, cables coaxiales o cables de fibra óptica. Cada sitio mantiene una base de datos local y puede manejar tanto transacciones locales (acceder a datos locales) como transacciones globales (acceder a datos de varios sitios) para procesar la información almacenada, se utiliza un sistema de gestión de bases de datos distribuida (SABDD), que conforma un programa que permite la gestión de la base de datos, de modo que su gestión sea transparente para los usuarios. Usado como si fuera una instalación local: SABDD se puede distribuir físicamente en una red ya sea local (LAN) o de área amplia (WAN).
El principal objetivo de SABBDD es compartir y acceder a la información de manera confiable y eficiente. Si hay diferentes sitios conectados, los usuarios de un sitio pueden acceder a los datos de otro. Además, si el problema ocurre en un sitio, los otros sitios pueden seguir funcionando normalmente. Para los usuarios, la distribución es completamente transparente y gestiona la base de datos como si estuviera centralizada. De esta forma, cuando se ejecuta una consulta con datos de varias ubicaciones, la consulta se divide en subconsultas que se ejecutan en paralelo.
Bases de datos distribuidas
Una base de datos distribuida es un conjunto de varias bases de datos vinculadas lógicamente distribuidas en diferentes ubicaciones interconectadas por una red de comunicaciones, capaz de procesamiento independiente, lo que indica que pueden realizar operaciones locales o distribuidas. Un sistema de base de datos distribuida (SBDD) es un sistema en el que varias ubicaciones de bases de datos están vinculadas por un sistema de comunicación para que los usuarios desde cualquier ubicación puedan acceder a los datos en cualquier lugar de la red.
Los principios básicos de las bases de datos distribuidas son: desde el punto de vista del usuario, un sistema distribuido es lo mismo que un sistema no distribuido en otras palabras, los usuarios de un sistema distribuido deben comportarse exactamente como el sistema no estuviera distribuido. Todos los problemas del sistema distribuido son (o deberías ser) a nivel interno o de implementación, no a nivel externo o de usuario.
Los fundamentos recién definidos de los sistemas distribuidos, conduce a diferentes objetivos de la siguiente manera
- Autonomía local
Los sitios del sistema distribuido deben ser independientes la autonomía local significa que todas las actividades de un sitio web en particular están controladas por ese sitio web; ningún sitio X tiene que depender de otro sitio Y para funcionar correctamente. La confidencialidad, integridad y representación del almacenamiento de datos local permanecen bajo el control y la autoridad local.
- No dependencia de un sitio central
La autogestión local significa que todos los sitios deben ser tratados por igual. Por lo tanto, no debe haber una dependencia especifica de una ubicación de concentrador “principal” para un servicio centralizado, de modo que todo el sistema depende de esa ubicación central.
- Operación continua
Una de las ventajas de los sistemas distribuidos es que deben brindar mayor confiabilidad y mayor disponibilidad.
- Confiabilidad: la posibilidad de que el sistema se ejecute en algún momento. SD no es todo o nada; pueden continuar funcionando cuando hay una falla de un componente independiente.
- Disponibilidad: la probabilidad de que el sistema funcione de forma continua durante un periodo de tiempo específico.
- Independencia de ubicación
- Los usuarios no necesitan saber dónde se almacenan los datos, pero podrán actuar como si todos los datos estuvieran almacenados en su ubicación local.
- Esto simplifica los programas de usuario. En particular, permite que los datos se transfieran de una ubicación a otra sin invalidar dichos programas o procesos.
- Independencia de fragmentación
El sistema admite la segmentación de datos cuando se puede dividir en partes para su almacenamiento físico.
- La fragmentación es necesaria por motivos de rendimiento los datos se pueden almacenar donde se utilizan con más frecuencia para que la mayoría de las operaciones sean locales y se reduzca el tráfico de la red.
Los usuarios deben actuar como si los datos no estuvieran realmente fragmentados
- Independencia de replicación
El sistema admite la transcripción de datos cuando una canción puede estar representada por muchas copias o transcripciones diferentes, que se almacenan en diferentes lugares se necesitan copias por dos razones principales:
- Significan un mejor rendimiento (las aplicaciones pueden ejecutarse en copias locales en lugar de tener que conectarse a sitios remotos)
- Puede significar una mejor disponibilidad (el objeto clonado todavía está disponible para su procesamiento, siempre que haya al menos una copia). Por supuesto, la principal desventaja de los espejos es que actualizarlo todos requiere la publicación de actualizaciones.
- Procesamiento de consultas distribuidas
La optimización es más importante en un sistema distribuido que un sistema centralizado incluso más.
- La conclusión es que en una consulta que incluye varios sitios, habrá varias formas de mover datos a través del sistema para satisfacer la consulta, y encontrar una estrategia eficaz es fundamental.
- Administración de transacciones distribuidas
Hay dos aspectos principales de la gestión de transacciones: retroceso y control de concurrencia.
- Ambos aspectos requieren un procesamiento extenso en un entorno distribuido
- Una sola transacción puede implicar la ejecución de código en varios sitios.
- Esto puede implicar la actualización a múltiples ubicaciones y se debe tener cuidado para garantizar que la transacción no caiga en un cierre fatal (basado en bloqueos.
- Para que el control persista, es necesario asegurarse de que una transacción determinada sea atómica en un entorno distribuido, por lo que el sistema debe asegurarse de que la transacción este confirmada o revertida (quizás utilizando un protocolo de aserción dos etapas).
- Independencia de hardware
Soporte para una gran cantidad de dispositivos diferentes. Es posible combinar todos los datos de todos estos sistemas y presentar una “imagen única del sistema” al usuario.
- Independencia de sistema operativo
Obviamente, no solo es necesario poder ejecutar el mismo DBMS en diferentes plataformas de hardware sino también ejecutarlo en diferentes sistemas operativos.
...