Introducción a la tolerancia a las fallas y recuperación
Enviado por carlo07man • 9 de Diciembre de 2022 • Ensayo • 812 Palabras (4 Páginas) • 116 Visitas
[pic 1] Sistemas Distribuidos
[pic 2]
UNIVERSIDAD TECNOLÓGICA DEL PERÚ
CURSO
Sistemas Distribuidos
TÍTULO DEL TRABAJO
Introducción a la tolerancia a las fallas y recuperación
INTEGRANTES
Adolfo Pérez Champa (0831270)
Carlo Manuel Escalante Guevara (0910958)
Antony Tasayco Cappillo (U20301950)
Lima, 27 de febrero del 2021
Introducción a la Tolerancia a las Fallas
El concepto de la tolerancia a fallas está relacionada directamente con el concepto de sistemas fiables, la cual tiene requerimientos para los sistemas distribuidos, entre ellos están la disponibilidad, confiabilidad, seguridad y mantenimiento; la disponibilidad es la probabilidad de que es sistema funcione y que pueda ser utilizado de inmediato y en cualquier momento, la confiabilidad en un sistema significa que puede funcionar continuamente sin fallar, la seguridad en un sistema se refiere a que si este dejara de funcionar durante un periodo de tiempo, nada malo podría ocurrirá, el mantenimiento en un sistema se refiere a la facilidad con la que un sistema puede ser reparado después de fallar y definimos como falla a la causa de un evento o error que hace que un sistema no pueda cumplir el propósito para el que fue creado. Entonces podríamos decir que un sistema fiable está estrechamente relacionado con el control de fallas, lo que significa que un sistema con alta tolerancia a fallas es aquel que puede continuar ejecutándose normalmente aun cuando hayan fallas, asimismo, se pueden clasificar a las fallas como transitorias, es decir cuando ocurren una vez y luego desaparecen, las fallas también podemos clasificarlas como intermitentes, es decir cuando aparecen y desaparecen sucesivamente y por último podemos clasificar una falla como permanente cuando el componente que ocasiona el defecto es reemplazado por completo.
Modelos de falla
Como todo en la vida, un sistema que falla no cumple la función para la que fue diseñado. Si hablamos de un sistema distribuido como un conjunto de servidores que están intercomunicados, entonces no realizar los servicios significa que no se está haciendo lo que debería. Pero no siempre la falla ocurrida es la que buscamos.
Aparecen con frecuencia estos fallos. Por ejemplo un disco que falla puede complicar las tareas de un servidor. Si el servidor es parte de una base de datos, las funciones de toda la base de datos se complican.
Para saber qué tan grave es una falla, se han desarrollado varios esquemas de clasificación.
Existen distintos tipos de fallas, las presentamos y explicamos a continuación.
- Falla de congelación.- Cuando un servidor se encuentra funcionando normalmente y de improviso se detiene. En cuanto se haya detenido el servidor, no hay más respuesta. Muchos sistemas tienen este tipo de fallas que hasta se creen normales.
- Falla de omisión.- Es cuando el servidor no atiende un pedido, normalmente es porque no se recibió la petición o la respuesta, puede deberse a que la comunicación no se entablo correctamente. Algunas fallas pueden deberse a bucles infinitos.
...