ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Los 13 tipos de datos


Enviado por   •  30 de Julio de 2023  •  Resumen  •  2.729 Palabras (11 Páginas)  •  67 Visitas

Página 1 de 11

LOS 13 TIPOS DE DATOS

Los datos son un tema espinoso. Para empezar, no estamos seguros de cómo se supone que debemos referirnos a él, es decir, datos es el plural de dato. Estrictamente hablando, deberíamos hablar de datos que "son" y no "están" disponibles para respaldar una teoría, etc. El periódico The Guardian discutió el debate aquí y pareció sugerir que (a pesar de los infinitivos divididos y los matices del latín idiomático) se permite que el uso del término permanezca convenientemente gramaticalmente incorrecto.

“Por si sirve de algo, puedo decir con confianza que esta será probablemente la única vez que escriba la palabra 'dato' en una publicación [de blog]. Los datos como término plural pueden ser el uso adecuado, pero el lenguaje evoluciona y queremos escribir en términos que todos entiendan, y que no parezcan ridículos”, escribió Simon Rogers , en 2012, antes de pasar a su puesto como editor de datos en Google.

Entonces, de las muchas instancias diferentes de datos individuales (perdón, datos) que existen, ¿podemos agruparlos en distintos tipos, categorías, variedades y clasificaciones? En este mundo de la llamada transformación digital y la computación en la nube que impulsa nuestros estilos de vida siempre activos y súper conectados, seguramente sería útil comprender el qué, cuándo, dónde y por qué de los datos en nuestro viaje para luego comenzar a apreciar el cómo. factor.

1 - Grandes datos

Un favorito central, los grandes datos han surgido para definirse como algo así como: esa cantidad de datos que prácticamente no caben en una base de datos estándar (relacional) para el análisis y el procesamiento causado por los enormes volúmenes de información creados por humanos y generados por máquinas. procesos.

“Si bien las definiciones de 'grandes datos' pueden diferir ligeramente, en la raíz de cada uno hay conjuntos de datos muy grandes y diversos que incluyen datos estructurados, semiestructurados y no estructurados, de diferentes fuentes y en diferentes volúmenes, desde terabytes hasta zettabytes. Se trata de conjuntos de datos tan grandes y diversos que es difícil, si no imposible, que las bases de datos relacionales tradicionales los capturen, administren y procesen con baja latencia”, dijo Rob Thomas , gerente general de IBM Analytics .

Thomas sugiere que los grandes datos son un gran problema porque son el combustible que impulsa cosas como el aprendizaje automático, que forman los componentes básicos de la inteligencia artificial (IA). Él dice que al profundizar (y analizar) los grandes datos, las personas pueden descubrir patrones para comprender mejor por qué sucedieron las cosas. Luego, también pueden usar la IA para predecir cómo pueden suceder en el futuro y prescribir direcciones estratégicas basadas en estos conocimientos.

2 - Datos estructurados, no estructurados, semiestructurados

Todos los datos tienen una estructura de algún tipo. Delinear entre datos estructurados y no estructurados se reduce a si los datos tienen un modelo de datos predefinido y si están organizados de una manera predefinida.

Mat Keep es director sénior de productos y soluciones en MongoDB . Keep explica que, en el pasado, las estructuras de datos eran bastante simples y, a menudo, se conocían antes del diseño del modelo de datos, por lo que los datos generalmente se almacenaban en el formato tabular de filas y columnas de las bases de datos relacionales.

“Sin embargo, el avance de las aplicaciones modernas web, móviles, sociales, de IA y de IoT, junto con la programación moderna orientada a objetos, rompen ese paradigma. Los datos que describen una entidad (es decir, un cliente, producto, activo conectado) se gestionan en código como objetos completos , que contienen elementos profundamente anidados . La estructura de esos objetos puede variar (polimorfismo), es decir, algunos clientes tienen un perfil de redes sociales que se rastrea y otros no. Y, con metodologías de desarrollo ágiles, las estructuras de datos también cambian rápidamente a medida que se crean nuevas funciones de aplicación”, dijo Keep.

Como resultado de todo este polimorfismo actual, muchos desarrolladores de software buscan alternativas más flexibles a las bases de datos relacionales para acomodar datos de cualquier estructura.

3 - Datos con sello de tiempo

 Los datos con marca de tiempo son un conjunto de datos que tiene un concepto de ordenamiento temporal que define la secuencia en la que se capturó cada punto de datos (tiempo del evento) o se recopiló (tiempo procesado).

“Este tipo de datos generalmente se usa cuando se recopilan datos de comportamiento (por ejemplo, acciones de los usuarios en un sitio web) y, por lo tanto, es una representación real de las acciones a lo largo del tiempo. Tener un conjunto de datos como este es invaluable para los científicos de datos que trabajan en sistemas que tienen la tarea de predecir o estimar los siguientes mejores modelos de estilo de acción, o realizar análisis de viaje, ya que es posible reproducir los pasos de un usuario a través de un sistema, aprender de los cambios sobre tiempo y responder”, dijo Alex Olivier , gerente de producto de la empresa de plataforma de software de personalización de marketing Qubit .

4 - Datos de la máquina

En pocas palabras, los datos de las máquinas son el escape digital creado por los sistemas, las tecnologías y la infraestructura que impulsan las empresas modernas.

Matt Davies , jefe de marketing de EMEA en Splunk , nos pide que pintemos un cuadro e imaginemos un día típico en el trabajo, conduciendo a la oficina en su automóvil conectado, iniciando sesión en su computadora, haciendo llamadas telefónicas, respondiendo correos electrónicos, accediendo a aplicaciones. Davies explica que toda esta actividad crea una gran cantidad de datos de máquina en una variedad de formatos impredecibles que a menudo se ignoran.

“Los datos de la máquina incluyen datos de áreas tan variadas como interfaces de programación de aplicaciones (API), puntos finales de seguridad, colas de mensajes, eventos de cambio, aplicaciones en la nube, registros de detalles de llamadas y datos de sensores de sistemas industriales”, dijo Davies. “Sin embargo, los datos de las máquinas son valiosos porque contienen un registro definitivo en tiempo real de toda la actividad y el comportamiento de los clientes, usuarios, transacciones, aplicaciones, servidores, redes y dispositivos móviles”.

...

Descargar como (para miembros actualizados) txt (18 Kb) pdf (129 Kb) docx (240 Kb)
Leer 10 páginas más »
Disponible sólo en Clubensayos.com