Apuntes: Gestión de Información II Bases de datos Adquiridas
Enviado por Camilo Sora • 16 de Septiembre de 2020 • Tarea • 8.686 Palabras (35 Páginas) • 96 Visitas
Apuntes: Gestión de Información II
Bases de datos Adquiridas:
Una base de datos distribuida (BDD) es un conjunto de múltiples bases de datos lógicamente relacionadas las cuales se encuentran distribuidas en diferentes espacios lógicos y geográficos (pej. un servidor corriendo 2 máquinas virtuales) e interconectados por una red de comunicaciones. Dichas BDD tienen la capacidad de realizar procesamientos autónomos, estos permiten realizar operaciones locales o distribuidas.
Un Sistema de Bases de Datos Distribuida (SBDD), en inglés Distributed Database Management System (DDBMS), es un sistema en el cual múltiples sitios de bases de datos están ligados entre sí por un sistema de comunicaciones de tal forma que, un usuario en cualquier sitio puede acceder los datos en cualquier parte de la red exactamente como si estos fueran accedidos de forma local.
Los sistemas de almacenamiento distribuidos son un conjunto de bases de datos que están repartidas de manera lógica por diferentes lugares geográficos.
Un sistema distribuido de bases de datos se almacena en varias computadoras. Los principales factores que distinguen un SBDD de un sistema centralizado son los siguientes:
- Hay múltiples computadores, llamados sitios o nodos.
- Estos nodos deben de estar comunicados por medio de algún tipo de red de comunicaciones para transmitir datos y órdenes entre los sitios.
En función de cómo se distribuye la información en los distintos nodos, se pueden encontrar los siguientes tipos de bases de datos:
(Nodos: En informática y en telecomunicación, de forma muy general, un nodo es un punto de intersección, conexión o unión de varios elementos que confluyen en el mismo lugar).
[pic 5]
Bases de Datos Centralizada: Es muy similar al modelo de Cliente/Servidor en el sentido que la BDD está centralizada en un lugar y los usuarios están distribuidos. Este modelo solo brinda la ventaja de tener el procesamiento distribuido ya que en sentido de disponibilidad y fiabilidad de los datos no se gana nada.
Una base de datos centralizada es una base de datos almacenada en su totalidad en un solo lugar físico, es decir, es una base de datos almacenada en una sola maquina y en una sola CPU. Esta ubicación es lo más a menudo un sistema informático central o base de datos, por ejemplo, un ordenador de sobremesa o servidor CPU, o una computadora central.
Ventajas
Bases de datos centralizadas tienen una cantidad sustancial de ventajas frente a otros tipos de bases de datos. Algunos de ellos se enumeran a continuación:
- Integridad de los datos se maximiza y la redundancia de datos se reduce al mínimo, como el lugar de almacenamiento única de todos los datos también implica que un conjunto dado de datos sólo tiene un registro primario. Esto ayuda en el mantenimiento de los datos más precisos y lo más consistente posible y mejora la fiabilidad de los datos.
- Generalmente más grandes seguridad de los datos, como la ubicación única de almacenamiento de datos implica sólo un posible lugar desde el que la base de datos puede ser atacado y conjuntos de datos puede ser de robo o manipulación.
- Mejor conservación de datos que otros tipos de bases de datos debidas a menudo incluye la configuración tolerante a fallos.
- Más fácil de utilizar por el usuario final debido a la simplicidad de tener un único diseño de base de datos.
- Generalmente es más fácil portabilidad de datos y administración de bases de datos.
- Más rentable que otros tipos de sistemas de bases de datos como los costos de mano de obra, suministro de energía y mantenimiento son todos minimizado.
- Los datos conservados en el mismo lugar son más fáciles de cambiar, reorganizado, reflejado, o analizado.
- Toda la información se puede acceder al mismo tiempo desde la misma ubicación.
- Cambios a cualquier conjunto dado de datos se reciben inmediatamente por cada usuario final.
Desventajas
Las bases de datos centralizadas también tienen una cierta cantidad de limitaciones, tales como los descritos a continuación:
- Bases de datos centralizadas son dependientes de la conectividad de red de alta. Cuanto más lenta la conexión a Internet es, más largo será el tiempo de acceso a la base de datos necesaria será.
- Los cuellos de botella pueden ocurrir como resultado de alto tráfico.
- El acceso limitado por más de una persona al mismo conjunto de datos ya que sólo hay una copia de la misma y que se mantiene en un solo lugar. Esto puede dar lugar a importantes disminuciones en el rendimiento general del sistema.
- Si no hay ninguna configuración tolerante a fallos y se produce un fallo de hardware, se perderán todos los datos dentro de la base de datos.
- Dado que existe un mínimo o ninguna redundancia de datos, si un conjunto de datos se pierde de forma inesperada que es muy difícil de recuperar de nuevo, en la mayoría de los casos, tendría que hacerse manualmente.
Bases de datos Replicadas:
El esquema de BDD de replicación consiste en que cada nodo debe tener su copia completa de la base de datos. Es fácil ver que este esquema tiene un alto costo en el almacenamiento de la información. Debido a que la actualización de los datos debe ser realizada en todas las copias, también tiene un alto costo de escritura, pero todo esto vale la pena si tenemos un sistema en el que se va a escribir pocas veces y leer muchas, y dónde la disponibilidad y fiabilidad de los datos sea de máxima importancia.
Una replicación de base de datos es una técnica mediante la cual copiamos de forma exacta en otra ubicación una instancia de la base de datos. Se utiliza en entornos distribuidos de Sistemas de Gestión de Bases de Datos donde una sola base de datos tiene que ser utilizada y actualizada en varios lugares de forma simultánea.
Tipos de replicación de base de datos
Podemos hablar al menos de 3 tipos de replicación de base de datos:
- Replicación Instantánea: los datos de un servidor son simplemente copiados a otro servidor o a otra base de datos dentro del mismo servidor. Al copiarse todo no necesitas un control de cambios. Se suele utilizar cuando los datos cambian con muy poca frecuencia.
- Replicación Transaccional: primero se envía una copia completa de la base de datos y luego se van enviando de forma periódica (o a veces continua) las actualizaciones de los datos que cambian. Se utiliza cuando necesitas que todos los nodos con todas las instancias de la base de datos tengan los mismos datos a los pocos segundos de realizarse un cambio.
- Replicación de mezcla: los datos de dos o más bases de datos se combinan en una sola base de datos. En primer lugar, se envía una copia completa de la base de datos. Luego el Sistema de Gestión de Base de Datos va comprobando los cambios que van apareciendo en los distintos nodos y a una hora programada o a petición los datos se sincronizan. Es sobre todo útil cuando cada nodo suele utilizar solo los datos que se actualizan allí pero que por circunstancias necesita tener también los datos de los otros sitios.
Beneficios:
- Aumento de la fiabilidad: mediante la replicación de base de datos a través de múltiples servidores, te aseguras que los datos van a estar disponibles incluso en el caso de que una de las máquinas tenga un fallo grave de hardware. El sistema distribuido de gestión de bases de datos debe ser capaz de enrutar a los usuarios afectados a otro de los nodos disponibles.
- Mejora en el rendimiento: al estar los datos distribuidos en diferentes servidores, los múltiples accesos no saturan los servidores. Esto es importante sobre todo en el caso de aplicaciones que pueden tener miles o cientos de miles de peticiones simultáneas. El rendimiento de las aplicaciones aumenta notablemente.
- Mejora en la seguridad de los datos: en un sistema transaccional tradicional, todas las actualizaciones de una base de datos se guardan en un mismo disco. La seguridad de tus datos queda entonces en manos de la estrategia de copias de seguridad que tengas implementada en ese servidor. Con la replicación de base de datos aumentas la seguridad de los datos ya que las actualizaciones están siendo escritas en varios servidores. Es decir, varios discos, varias fuentes de alimentación, CPU’s, etc. son utilizadas para asegurar que tus datos estarán a salvo en algunos servidores, aunque pueda ocurrir un desastre en otros.
Bases de datos Particionadas:
Este modelo consiste en que solo hay una copia de cada elemento, pero la información está distribuida a través de los nodos. En cada nodo se aloja uno o más fragmentos disjuntos de la base de datos. Como los fragmentos no se replican esto disminuye el costo de almacenamiento, pero también sacrifica la disponibilidad y fiabilidad de los datos. Algo que se debe tomar en cuenta cuando se desea implementar este modelo es la granularidad de la fragmentación.
...