ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Hadoop


Enviado por   •  15 de Octubre de 2018  •  Tarea  •  742 Palabras (3 Páginas)  •  114 Visitas

Página 1 de 3

HADOOP

 Este sistema fue creado por Doug Cutting el cual le puso este nombre porque así se llamaba su elefante de juguete. Por este motivo el logo y el nombre. En primera instancia fue hecho con el fin de ayudar en un proyecto de motor de búsqueda llamado Nutch el cual es un robot y motor de búsqueda basado en Lucene. Es parte del proyecto Lucene que a su vez es gestionado por la Apache Software Foundation. Nutch es software libre.

Es un sistema de marco de trabajo (framework) en el podemos distribuir un amplio número de datos por medio de unos ordenadores que están agrupados, estos utilizan unos modelos de programación básico o simple. Fue creado con el propósito de llevar de los servidores individuales a muchas maquinas, cada servidor con un nivel de procesamiento y almacenamiento local. Este sistema en vez de prestar toda la atención en el hardware para prestar el servicio de buena disponibilidad, tiene una biblioteca que está hecha para detectar y controlar cada error en la capa de aplicación esto puede ser propenso a que falle. Hadoop es un sistema bajo un licenciamiento libre y permite a las aplicaciones trabajar con miles de nodos y petabytes de datos. Hadoop se inspiró en los documentos Google para Map Reduce y Google File System (GFS).
Intercambio de recursos. Con hadoop podemos tener una variedad de partes o módulos los cueles se han desarrollado como Hadoop Distributed File System (HDFS),el cual es un sistema que implementa la utilización de archivos distribuidos y permite que el acceso a estos tengan un alto rendimiento la aplicación. es uno de los servidores Web más utilizados y una parte vital cuando alojamos un website o un servicio Web. Este cuenta con varias herramientas que nos pueden ayudar a reforzar la resistencia de nuestro website. En este documento vamos a ver algunas las principales características, en las cuales está la de  multiplataforma que
corre en una multitud de Sistemas Operativos, lo que lo hace prácticamente universal, extensible, gracias a ser modular se han desarrollado diversas extensiones entre las que destaca PHP que es un lenguaje de programación del lado del servidor, modular puede ser adaptado a diferentes entornos y necesidades, con los diferentes módulos de apoyo que proporciona y con la API de programación de módulos, para el desarrollo de módulos específicos y por ultimo Apache es una tecnología gratuita de código fuente abierto. El hecho de ser gratuita es importante pero no tanto como que se trate de código fuente abierto. Esto le da una transparencia a este software de manera que si queremos ver que es lo que estamos instalando como servidor.

La instalación necesaria depende del sistema operativo. Todas las distribuciones Linux cuentan con un servidor Apache integrado en la propia distribución por lo cual solamente hay que seleccionar la opción de instalar el servidor para que éste quede instalado y funcionando.

Ventajas:

  • Un menor coste

Al estar basado en un gran número de pequeños ordenadores, cada uno de ellos procesa una parte

de la información pero actúan de forma coordinada. De este modo, el resultado es una ventaja

comparativa sin competencia: funciona como un ordenador de enormes dimensiones.

...

Descargar como (para miembros actualizados) txt (5 Kb) pdf (114 Kb) docx (13 Kb)
Leer 2 páginas más »
Disponible sólo en Clubensayos.com