Clusterin E Indexacion
Enviado por hugo1232 • 23 de Agosto de 2013 • 3.740 Palabras (15 Páginas) • 330 Visitas
Universidad San Carlos de Guatemala.
Facultad de Ingeniería.
Escuela de Ciencias y Sistemas.
Manejo e Implementación de Archivos.
Ing. Oscar Alejandro Paz Campos
CLUSTERING E INDEXACIÓN
Mydelin Stephanie Valladares Lima 2011-13845
Ana Lucía López Grajeda 2011-14819
Javier Estuardo Tello Flores 2009-15255
Erik Leonel Flores Pérez 2010-21245
Hugo Gonzalez Negreros 2011-22889
CLUSTERING
Un clúster es un sistema de computadoras que están interconectadas y trabajan como una sola, procesamiento paralelo o distribuido.
El cómputo con clústeres surge como resultado de la convergencia de varias tendencias actuales que incluyen la disponibilidad de microprocesadores económicos de alto rendimiento y redes de alta velocidad, el desarrollo de herramientas de software para cómputo distribuido de alto rendimiento, así como la creciente necesidad de potencia computacional para aplicaciones que la requieran.
De un clúster se espera que presente combinaciones de los siguientes servicios:
1. Alto rendimiento
2. Alta disponibilidad
3. Balanceo de carga
4. Escalabilidad
Balanceo de Carga:
Compartir el trabajo a realizar entre varios procesos. Se mantiene por un algoritmo que divide de la manera más equitativa posible el trabajo, para evitar cuello de botella. (Software Balanceadores de Carga: Red Hat Piranha, LVS, ISA Server, Wingate, openMosix)
Escalabilidad:
Propiedad de aumentar de trabajo o de tamaño de un sistema sin comprometer su funcionamiento y calidad.
Escalabilidad Vertical: actualizaciones o modernización de componentes existente.
Escalabilidad Horizontal: aumentar el número de componentes del sistema.
Ancho de Banda:
Cantidad de datos que se puede enviar a través de una conexión de red en un periodo de tiempo (bps, kbps, mps, etc.).
Latencia:
Suma de retardos temporales en una red, producido por la demora en la transmisión de paquetes. Es provocado por factores como el tamaño de los paquetes transmitidos, tamaño de buffers dentro de equipos de conectividad.
Protocolo de conexión:
Conjunto de reglas que permiten que las computadoras se comuniquen. Divididas en capas, la capa inferior solamente necesita saber cómo comunicarse con las capa inferior y superior a él.
Conmutación de Paquetes:
Método de envió de datos en una red. Un paquete es un grupo de información que consta de dos partes (datos, información de control que indica la ruta a seguir en la red hasta el destino), si un paquete es muy grande se divide en otros más pequeños.
Componentes de un Clúster:
Nodos (worksation):
Cada una de las máquinas de la red.
Nodos Dedicados: no disponen de periféricos (teclado, monitor, mouse), están orientados únicamente a realizar tareas relacionadas al clúster.
Nodos No Dedicados: su funcionamiento es para que el clúster haga uso de ciertos recursos que no están siendo utilizados por el usuario de la máquina.
Almacenamiento:
El almacenamiento de clúster se puede dar por medio de NAS, SAN o en uno de los servidores (nodos).
Conexión de Red:
Red Ethernet
Fast Ethernet
Gigabit Ethernet
Myrinet
SCI
InfiniBand
Middleware:
Este es un software que actúa entre el sistema operativo y las aplicaciones con la finalidad de proveer a un clúster:
Una interfaz única de acceso al sistema (SSI) , la cual genera la idea de usar un único
ordenador.
Herramientas para optimización y mantenimiento del sistema.
Escalabilidad.
Balanceador de carga.
Migrar Procesos (cambiar el proceso de un servidor a otro para mejor desempeño).
Un middleware recibe los Jobs entrantes al clúster y los redistribuye de manera equitativa entre los nodos para que el proceso se ejecute más rápido y el sistema no sufra sobrecargas en un servidor.
Existen diversos tipos de middleware como:
MOSIX
OpenMOSIX
Condor
OpenSSI
Herramientas de Desarrollo: son ambientes de programación paralela, que permiten implementar algoritmos que hagan uso de recursos compartidos de cpu, memoria, datos y servicios.
Compiladores (C,C++, Java) , programación paralela con C++.
RAD
Debuggers
Herramientas de análisis y visualización.
Tipos de Clúster:
Clúster Homogéneos: son los que tiene la misma configuración (mismo sistema operativo, mismo hardware)
Clúster Semi Homogéneo: diferente rendimiento pero con arquitecturas y sistemas operativos similares.
Clúster Heterogéneo: diferente hardware y sistema operativo.
Clusters de Bases de Datos:
Al hablar de clusters en bases de datos se hace referencia a una arquitectura en la que varios equipos con parte de los datos del usuario trabajando al unísono como un solo sistema. La arquitectura de un clúster de base de datos está definida por la manera en que se almacenan los datos en cada nodo.
Para asegurar mejores resultados en el funcionamiento de las bases de datos que son consultadas por diversas empresas para sus procesos de reportes o prestación de servicios.
Arquitecturas:
Arquitectura Tipo 1. En este tipo de arquitectura cada nodo del clúster posee parte de la información dentro de la base de datos y solamente procesa la información que él posee. Esta arquitectura es la más común entre los fabricantes de motores de bases de datos. Al multiplicarse los volúmenes de datos, su administración es un cargo muy costoso en algunas ocasiones, lo que está obligando a las empresas a tomar decisiones sobre qué hacer con la información, cómo almacenarla y quién debe administrarla.
Arquitectura
...