Actividad Final: Análisis de Datos
Enviado por Rafael Márquez G. • 22 de Febrero de 2024 • Tarea • 2.347 Palabras (10 Páginas) • 91 Visitas
[pic 1]
MAESTRÍA EN DIRECCIÓN DE ORGANIZACIONES
Materia:
DESARROLLO DE LAS COMPETENCIAS DIGITALES
Tarea:
“Actividad Final: Análisis de Datos”
PRESENTA
Alvarado Buenfil Rosaura Magdalena
Márquez Galicia Rafael
Sánchez Vargas Maria Yocelyn
Rodriguez Márquez Kevin Julián
PROFESOR
Mtro. Irvin Arlin Chan Ac
iachan@utcancun.edu.mx
Cancún, Quintana Roo 03/ Febrero/ 2024
ÍNDICE
INTRODUCCIÓN:
En la actualidad existe una abundancia y un mundo de datos generados constantemente lo cual ha permitido ser un pilar esencial para poder extraer conocimientos valiosos para la toma de decisiones fundamentadas, esta disciplina permite examinar, modelar e interpretar conjunto de datos con el objetivo de revelar tendencias, patrones y relaciones significativas. El análisis de datos ha ido adquiriendo mucho valor para las diversas áreas científicas y especialmente en la salud y financieras; tiene un carácter instrumental y proporciona las herramientas estadísticas para entender resultados obtenidos en base a la investigación y generar propios análisis de datos para alcanzar un entendimiento correcto con la información, como consecuencia desempeña un papel crucial para contar con una visión profunda de fenómenos, desde conjuntos de datos estructurados y no estructurados.
El proceso inicial es explorar y limpiar datos, seguido de algoritmos de aprendizaje y técnicas automatizadas para conocer patrones, y con ello contar con un resultado final de probabilidades y predicciones. En la exploración de información se puede extraer valor y oportunidades para poder potencializar técnicas de datos, a medida de que avanzamos con los años contar con más datos nos podrá facilitar y no errar en el futuro.
En el siguiente trabajo se podrá visualizar conceptos básicos de investigación, clasificaciones de los Análisis de datos, mapas con variables descriptivos, gráficas y explicaciones en base a la investigación del desarrollo de las competencias digitales.
Contenido de la primera parte del informe: Exploración descriptiva de los datos:
MARCO TEÓRICO:
La ciencia de los datos es un campo que utiliza métodos, sistemas, algoritmos y procesos científicos que extrae datos estructurados, que busca analizar patrones y tendencias y/o fenómenos a través de datos para la toma de decisiones.
En 2001, William S. Cleveland pública “Ciencia de Datos: un plan de acción para expandir las áreas técnicas del campo de la estadística”. Se trata de un escrito destinado a ampliar las áreas principales de trabajo del campo de las estadísticas.
La Inteligencia Artificial es un campo de la informática que busca desarrollar sistemas capaces de poder realizar tareas que normalmente requieren de la IA. Esto incluye el conocimiento y aprendizaje automático de un sistema, la IA aprovecha las máquinas para imitar las capacidades de resolución de problemas y la toma de decisiones de la mente humana; Según John McCarthy (2004) “Es la ciencia e ingeniería de hacer máquinas inteligentes, especialmente programas informáticos inteligentes. Se relaciona con la tarea similar de usar equipos para comprender la inteligencia humana, pero la IA no tiene que ajustarse a los métodos biológicos observables
Las aplicaciones en la mejora de la Gestión Empresarial se puede incluir análisis predictivo, optimización de procesos, detección de fraudes y la personalización del cliente de acuerdo a los requerimientos de las empresas y necesidades que con este conlleve, el fin de este es poder identificar las áreas de mejora para aumentar la eficiencia operativas y automatizar las tareas.
Google Colab es una herramienta de colaboración que se basa en la nube que utilizar el entorno de notebooks, que permite a los usuarios ejecutar códigos, facilitando la programación y los análisis de datos, algunas características que este incluye es el acceso a recursos de Google que permite realizar cálculos intensivos de manera eficiente, por lo que la colaboración en tiempo real permite trabajar en el mismo notebook simultáneamente facilitando la colaboración e integración con Google Drive que almacena los datos en uno solo, otra característica es que incluye bibliotecas preinstaladas de Python populares para el análisis de datos.
La combinación de todos estos puede potenciar significativamente la gestión empresarial al proporcionar insights valiosos que automatizan procesos y mejorar la toma de decisiones y así reducir los tiempos y movimientos.
- Describir los pasos realizados para la exploración de datos:
[pic 2]
Se importa la base de datos de un archivo externo al sitio de Google Colab, donde se debe dar todos los permisos pertinentes para crear una carpeta en Drive (es importante ingresar con una cuenta gmail para poder guardar la información). Al hacer este movimiento se crea en el sistema el dataset llamado “Employe_df”, a partir de ello se pueden solicitar los primeros cinco datos y los últimos donde se observó que son 1469 filas y 34 columnas de información que representa datos de cada empleado de la empresa.
[pic 3]
Entre dicha información se pudo destacar datos como son:
La edad, departamento, sueldo diario, frecuencia de viaje, educación, distancia de casa, género y años en la compañía .
Con dichos conceptos se tuvo datos estadísticos de nuestro dataset: Donde se concluye información como es:
- La edad mínima de un colaborador es de 18 años.
- La edad máxima de un colaborador es de 60 años.
- La distancia de casa-trabajo promedio es de 8.10 millas.
- La media de los salarios mensuales es de 6502.93.
- Los años de permanencia en la compañía máximos son de 60 y los mínimos
Son algunos ejemplos que se obtienen de la información proporcionada, ya que puedes ir observando y analizando cada rubro que se tiene en el dataset.
[pic 4]
Sin embargo para tener una correcta interpretación se deben convertir los valores en numéricos con la función “Attrition”. Donde convertimos las X= 1 y la Y= 0.
...