ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Tres Principales software para Big Data empresarial


Enviado por   •  24 de Febrero de 2019  •  Tarea  •  338 Palabras (2 Páginas)  •  222 Visitas

Página 1 de 2
  1. Tres Principales software para Big Data empresarial

Las tres Herramientas o Software que se usan son las siguientes:

  • Hadoop: esta es  un sistema de código abierto que nos ayuda y nos sirve para para almacenar, procesar y analizar grandes volúmenes de datos.

Este sistema o software puede almacenar toda clase de datos, como estructurados como no estructurados o semiestructurados.

El  80% de los datos con los que esta herramienta trabaja hoy en día no vienen clasifica en columnas y filas, esto se trata de una avalancha desordenada de correos electrónicos, fuentes de medios sociales, imágenes de satélites, señales de GPS, registros de servidor y otros archivos no relacionales sin estructurar.

Una de las ventajas de esta herramienta  Hadoop es que puede administrar prácticamente cualquier archivo o formato de manera que las organizaciones pueden plantearse cosas que nunca creyeron posibles.

  • Spark: Esta herramienta está considerada como el primer software de código abierto que hace la programación distribuida accesible a los científicos de datos. Este software como  Hadoop, Spark pertenece a Apache Software Fundación.

Esta es una infraestructura de informática de clúster de código abierto con proceso en memoria para agilizar las aplicaciones de analítica hasta 100 veces más comparado con las tecnologías actuales del mercado. Apache Spark puede reducir la complejidad de la interacción de los datos, aumentar la velocidad de proceso y mejorar las aplicaciones de misión crítica con amplia información útil.

  • Hive: Apache Hive este software es un sistema de almacén de datos que funciona para  Hadoop, esta nos permite realizar resúmenes de datos, también nos permite hacer consultas y análisis de datos mediante HiveQL (una lenguaje de consultas similar a SQL). Hive se puede también usar para explorar datos como de forma interactiva o como para crear trabajos de procesamiento por lotes reutilizables. Tambien nos va a permite proyectar la estructura del proyecto en datos que en gran medida no están estructurados. Después de definir la estructura, puede usar Hive para consultar esos datos sin conocimiento de Java o MapReduce.

  1. Técnicas de análisis cualitativo

...

Descargar como (para miembros actualizados) txt (2 Kb) pdf (68 Kb) docx (8 Kb)
Leer 1 página más »
Disponible sólo en Clubensayos.com