Volumen masivo de datos
Enviado por 1594623789 • 25 de Octubre de 2014 • Ensayo • 309 Palabras (2 Páginas) • 247 Visitas
Big data
Definición
"Big data" es un término aplicado a conjuntos de datos que superan la capacidad del software habitual para ser capturados, gestionados y procesados en un tiempo razonable. Los tamaños del "big data" se hallan constantemente en aumento. En 2012 se dimensionaba su tamaño en una docena de terabytes hasta varios petabyte de datos en un único data set. En la metodología MIKE2.0 dedicada a investigar temas relacionados con la gestión de información, definen big data en términos de permutaciones útiles, complejidad y dificultad para borrar registros individuales.
“Volumen masivo de datos, tanto estructurados como no-estructurados, los cuales son demasiado grandes y difíciles de procesar con las bases de datos y el software tradicionales" (ONU, 2012)
Las 4 dimensiones de big data
Genera datos cada milisegundo
Historia
Hace 16 años maso menos que se incio el big data
Características:
Todos los datos: No hace falta discriminar ya que la capacidad de memoria es infinita.
Rapidez: Los algoritmos permiten la toma de decisiones en micras de segundos.
Predecibles: Adelantan escenarios, permiten hacer inferencias con bases estadísticas.
Recursivos: Los sistemas aprenden y corrigen información.
Recombinables: Lo que permite crear nuevos análisis a partir de unir bases de datos.
Ubicuos: La información se obtiene desde lugares lejanos y a través de dispositivos (GPS para mejorar el flujo de transito).
Ventajas
Crean nuevos mercados y permiten el avance de la ciencia (usos en salud, prevención de desastres etc.)
Mejoran la calidad de vida de las personas (ahorran tiempo, apoyan la toma de decisiones).
Propician la eficacia y transparencia del gobierno (servicios 24 x 7 X 365).
Desventajas
Nano sensores que recabarán todo tipo de informaciones sin que sean perceptibles…
Predicciones en materia de salud, seguros o empleo que afectarán nuestra dignidad o provocarán discriminación…
Información VS conocimiento.
Utilidad del big data
Es utilizado para procesar grandes cantidades de dato para un fine determinado por el usuario
Software para procesamiento de gran informacion
1. Hadoop
2. Pentaho (open source business intelligence
3. Netezza
4. Vertica (an HP company)
5. Dataflux a sas company
6. Greenplum
...