La ciencia de datos : Data Science
Enviado por RAMIREZ TRUJILLO DIEGO MIGUEL • 7 de Octubre de 2023 • Informe • 2.403 Palabras (10 Páginas) • 42 Visitas
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS
FACULTAD DE INGENIERÍA INDUSTRIAL
ESCUELA PROFESIONAL DE INGENIERÍA INDUSTRIAL
[pic 1]
ASIGNATURA
AUTOMATIZACIÓN DE PROCESOS INDUSTRIALES
INFORME N°02
La ciencia de datos : Data Science
INTEGRANTES DEL GRUPO C
Apellidos y Nombres | Código |
Castillo Osorio Jeremy Dave | 20170170 |
Gonzales Ureta Rolly Ronaldo | 20170186 |
Ramirez Trujillo Diego Miguel | 20170127 |
Sanchez Coello Erika Maria Gracia | 20170059 |
Rivas Mendoza Jose Adrian | 20170223 |
DOCENTE
Mg. Madueño Macedo, Augusto Denis
Lima, Perú
2023
ÍNDICE
I. INTRODUCCIÓN 3
II. OBJETIVOS 4
III. Ciencia de datos, proceso y su relación con la Estadística e Informática 5
IV. Origen y evolución de la Ciencia de datos 7
V. Tipos de análisis y beneficios de la ciencia de datos 9
VI. Técnicas que se utilizan en la ciencia de datos y aplicaciones en la industria 10
VII. Perfil y herramientas que maneja un Data Scientist 11
VIII. Conclusiones 13
IX. Bibliografía 15
INTRODUCCIÓN
La Ciencia de Datos emerge como un campo fundamental para el análisis y la interpretación de datos en diversas industrias y disciplinas que ayuda en la toma de decisiones organizacionales. En esencia, la Ciencia de Datos se define como la combinación de diversos métodos, procesos, algoritmos y sistemas para obtener información y entender la realidad a partir de los datos, ya sean estructurados o no estructurados. Además este campo multidisciplinario se vale de técnicas estadísticas, matemáticas y computacionales para extraer “insights” valiosos en grandes conjuntos de datos.
Para un analista de datos, el abanico de herramientas disponibles es amplio y variado. Entre los softwares cruciales se encuentra SQL Server, que permite la creación y manejo eficiente de bases de datos relacionales; Python, un lenguaje de programación versátil y potente utilizado para análisis, modelado y visualización de datos; y Power BI, una herramienta brindada por Microsoft que posibilita la creación de informes dinámicos e interactivos a partir de bases de datos de fuentes diversas.
Ser un analista de datos implica ser un investigador apasionado, creativo, capaz de preguntarse la relación entre los datos y de diseñar soluciones innovadoras a los problemas. Asimismo, la ética toma un papel fundamental en este rol, ya que el manejo de los datos implica la responsabilidad de proteger la privacidad y la integridad de la información.
En resumen, la Ciencia de Datos es una disciplina en constante evolución que se nutre de datos para generar conocimiento y tomar decisiones informadas. Los analistas de datos cuentan con una variedad de herramientas tecnológicas y habilidades que les permite llevar a cabo esta tarea. Por tanto en el presente trabajo se describe la ciencia de datos desde diversos aspectos tales como su origen, proceso que utiliza, la relación que tiene con otras disciplinas, el perfil que debe tener un profesional de este campo, entre otros.
OBJETIVOS
General
- Describir la ciencia de datos desde diversos aspectos y su aplicación en la industria.
Específicos
- Describir la ciencia de datos, el proceso que utiliza y su relación con otras disciplinas.
- Describir su origen y evolución de la ciencia de datos.
- Describir los tipos de análisis que se pueden llevar a cabo y los beneficios que brinda a la empresa la ciencia de datos.
- Describir las técnicas que se utilizan en la ciencia de datos y aplicaciones en la industria.
- Describir el perfil y herramientas que utiliza un Data Scientist.
Ciencia de datos, proceso y su relación con la Estadística e Informática
La ciencia de datos es el estudio de datos con el fin de extraer información significativa para las empresas. Se considera un enfoque multidisciplinario ya que se basa en principios y prácticas de las matemáticas, la estadística, computación e inteligencia artificial para lograr esta tarea. Su importancia radica en que brinda “significado” a una gran cantidad de datos, ayudando a responder preguntas tales como “qué sucedió”, “por qué sucedió”, “qué sucederá” y “qué puedo hacer” (Amazon, 2023).
Los problemas empresariales pueden resolverse de la mano de un científico de datos quien, entendiendo las necesidades del negocio y el problema, procede a obtener, depurar, explorar, modelar e interpretar los resultados. En el siguiente gráfico se observa los detalles de cada una de las etapas del proceso:
Figura 1
Proceso de la ciencia de datos
[pic 2]
Nota. Elaboración propia.
La estadística e informática están relacionadas con la ciencia de datos. La ciencia de datos en similitud a la estadística tiene una gran gama de aplicaciones y su objetivo es recopilar información para realizar análisis. Asimismo un científico de datos a diferencia de un estadístico diseña sistemas que recopilan datos de cada cliente, por ejemplo, acerca de la visualización de videos y se usa para brindarles recomendaciones personalizadas. Por tanto, un científico de datos está más familiarizado con la informática que un estadístico. Debido a su enfoque en computadores y bases de datos, muchas personas consideran la ciencia de datos como una rama de la informática (MasterCienciaDatos, 2023).
...