Introducción a la ciencia de datos
Enviado por Barbara Urrea • 29 de Agosto de 2022 • Apuntes • 1.675 Palabras (7 Páginas) • 45 Visitas
[pic 1]
[pic 2]
[pic 3]
Índice
Introducción 3
Ciclo de vida de los datos y fuentes de extracción: 4
Beneficios del correcto uso del ciclo de datos 6
¿Netflix, Coca-Cola y Spotify utilizan Smart Data para la toma de decisiones? 7
Políticas de privacidad y seguridad de datos de sus clientes 8
Conclusión 9
Referencias Bibliográficas 11
Introducción
En la actualidad no todas las empresas utilizan los datos como requisito para su toma de decisiones, hemos visto en estas semanas que los datos son fundamentales para varios procesos dentro de una empresa.
En los casos estudiados, hemos visto los métodos de recomendaciones que emplean las empresas para llegar a sus clientes, además de reconocer que la utilización de datos trae grandes beneficios a las empresas cuando estos son bien utilizados.
Para lograr reunir la información necesaria que mencionamos, los datos deben ser estudiados y analizados correctamente siguiendo las distintas fases del ciclo de vida de datos, las que revisaremos a continuación basadas en las 3 empresas que hemos investigado estas últimas semanas.
Ciclo de vida de los datos y fuentes de extracción:
Al analizar el ciclo de vida de los datos de las empresas Spotify, Coca. Cola y Netflix, podemos encontrar lo siguiente:
EMPRESA |
|
|
| |||
CICLO DE DATOS | ||||||
Planificar | Tipo de película, genero de la película, actores preferidos, horarios de conexión, tiempo de conexión, etc. | Unidades vendidas por categorías, rendimiento de las plantas, sabores preferidos, tamaños más comprados. | Listas de canciones, historial streaming, pagos, seguimiento de cuentas, búsquedas, etc. | |||
Capturar | Captura datos con AWS (Amazon Web Service) desde el Big Data, cookies, etc. | Extrae datos del big data con Social Media, redes sociales, cookies, máquinas expendedoras, etc. | Captura los datos desde de aplicación Spotify y a través de algoritmos que extraen datos del big data, filtrado colaborativo, cookies, etc. | |||
Gestionar | Almacenamiento a través de AWS (Amazon Web Servicies), Open Connect, DynamoDB y Cassandra además tiene políticas de privacidad de uso de datos de cada usuario. | Almacenamiento en SAP ERP desde 1996 y recurre a la consultoría QA en las implementaciones y los procesos de cambio | Almacenamiento en MongoDB es una base de datos orientada a documentos. | |||
Analizar | Equipo de analistas e IA (Presto, Elasticsearch y Apache Kafka) | Equipo de analistas e IA (Kantar, Euromonitor y Social listening data) | Equipo de analistas, IA, herramientas colaborativas como Spotify For Artists y Spotify Analytics | |||
Archivar | Información de cuentas de usuarios (Historial, Listas, Tipo de pago, etc.,) | Digitalización de documentos, contratos, estudios de mercado, etc. | Información de cuentas de usuarios (Historial, Listas, Tipo de pago, etc.,) | |||
Destruir | Algunos datos de clientes que se dieron de baja se eliminan de acuerdo con las políticas de privacidad | Los datos de clientes que participaron de concursos o encuestas y solicitan eliminar sus datos. | Algunos datos de clientes que se dieron de baja de acuerdo con las políticas de privacidad |
Fuentes de Datos
- Netflix: Utiliza 3 fuentes de información, 1.- Sus propios abonados, 2.- Especialistas que etiquetan el contenido, 3.- Sus propios algoritmos y aprendizaje automático.
- Spotify: Utiliza fuentes de información de sus propios suscriptores y de terceros, 1.- Datos personales recopilados al suscribirse al servicio o al actualizar la cuenta, 2.- Datos personales recopilados a través del uso del servicio de Spotify.
3.- Datos personales que el mismo suscriptor de vez en cuando decide proporcionar u otorgar permisos para recopilar estos datos, donde se incluyen categorías de datos de voz, datos de pago y compra y datos de encuestas e investigación incluidos en la política de privacidad de Spotify.
4.- Datos personales que recopilan de fuentes de terceros. Esto principalmente se produce cuando un usuario se registra con otro servicio o conecta su cuenta de Spotify con una aplicación, servicio o dispositivo de terceros
- Coca Cola: Esta empresa utiliza un software llamado “TensorFlow” que permite recoger toda la información que puede otorgar una cadena de suministro basado en la demanda, para luego ser utilizada en la planificación digital de sus productos y su distribución. Además, desde 2015 sigue las menciones de los usuarios sobre sus productos para analizar las conversaciones en Social Media y extraer conclusiones importantes sobre la información obtenida, como por ejemplo que cada 2 segundos se habla en las redes sobre la marca.
Beneficios del correcto uso del ciclo de datos
En el caso de Netflix, esta empresa constantemente está innovando en el área del streaming, en los últimos años logró aumentar considerablemente la cantidad de suscriptores. Gracias a esto, Netflix es una de las empresas con mayor crecimiento, con US$30.4 mil millones en facturación y 203 millones de suscriptores según el reporte de 2021.
En el caso de Coca Cola, una empresa solida por varias décadas fue de las primeras empresas no tecnológicas en trabajar con big data, incluso digitalizó enormes cantidades de información de años anteriores con el fin de recopilar más antecedentes para el análisis de sus futuros productos, estos análisis, le permiten mantener el objetivo y seguir innovando para sus clientes. En 2021 reporta un rango de ingresos entre US$ 39.87 a US$ 44.1 mil millones.
...