BIG DATA
Enviado por alfonso.mejia • 2 de Septiembre de 2021 • Tarea • 486 Palabras (2 Páginas) • 70 Visitas
1. Big Data
En el 2001, el analista Doug Laney (2001) de META Group (ahora Gartner) utilizaba y
definía el término big data como el conjunto de técnicas y tecnologías para el tratamiento de
datos, en entornos de gran volumen, variedad de orígenes y en los que la velocidad de respuesta
es crítica.1
El sentido original del término datos masivos, o big data, tan solo hacía referencia a las
cantidades enormes de datos que se producen en la era digital. Estos volúmenes de datos, tanto
estructurados como no estructurados, incluyen todo el tráfico generado en la Red por el correo
electrónico, las páginas de Internet y las redes sociales, tal como lo afirma Holmes (2018):
Alrededor del 80 % de los datos globales son no estructurados y aparecen en forma de texto, fotos
e imágenes, lo que los torna inadecuados para los métodos tradicionales de análisis de datos
estructurados. En la actualidad, con datos masivos nos referimos no solo al volumen de datos
generados y almacenados en formato electrónico, sino también a conjuntos de datos específicos que
poseen al mismo tiempo tamaños y complejidades tan elevados que se requieren técnicas
algorítmicas nuevas para extraer de ellos información útil. Estos conjuntos de datos proceden de
fuentes variadas, así que echemos un vistazo más detallado a algunas de ellas y a los datos que
generan. (p.12)
De acuerdo con lo anteriormente expuesto por el autor se deduce que es tan grande el
volumen de información electrónica o digital presente en la red de internet procedentes de
diferentes fuentes, que se hace prácticamente imposible su manejo manual o convencional
por lo cual se necesita la ayuda de herramientas tales como los motores de búsqueda para
el procesamiento de tanta y variada información.
2. Datos de motores de búsqueda
Al realizar una consulta en un motor de búsqueda se produce un listado de los sitios de
Internet más relevantes, pero a la vez se recopila una cantidad considerable de datos.
Gracias a algunos programas básicos de rastreo, descubrí que el simple hecho de pulsar en ese enlace
que conduce a un solo sitio de Internet indujo sesenta y siete conexiones adicionales por parte de
terceros. Las empresas comerciales comparten información de este modo con el fin de averiguar los
intereses de quienes acceden a los sitios de Internet.
Cada vez que se utiliza un motor de búsqueda se producen registros en los que consta a qué
direcciones recomendadas se accede. Estos registros contienen información útil, como el
término de búsqueda utilizado, la dirección IP del dispositivo empleado, en qué instante se
efectuó la consulta, cuánto tiempo se permanece en cada sitio y en qué orden se pulsan los
enlaces.
...