Seminario de Gestión Empresarial
Enviado por camila sanhueza • 17 de Diciembre de 2022 • Biografía • 2.157 Palabras (9 Páginas) • 40 Visitas
[pic 1][pic 2]
Trabajo en Clases N°1
Business Intelligence
Integrante: Camila Sanhueza Salas
Profesor: Marcel Minutolo
Fecha: 12/11/2022
Asignatura: Seminario de Gestión Empresarial
Módulo: Business Intelligence
Lea el siguiente artículo, Lecciones aprendidas: un estudio de caso que utiliza la minería de datos en la industria de los periódicos Haga clic para ver más opciones y los dos primeros capítulos del libro de texto (Ciencia de datos para empresas, denominado DSFB en lo sucesivo), y luego responda lo siguiente preguntas.
Incluya las preguntas con sus respuestas en un documento y luego envíe el documento completo a Blackboard. Incluya su nombre y apellido en su nombre de archivo. Por ejemplo, si estuviera enviando esta tarea, usaría el siguiente nombre de archivo: mark_haney_wk1_assign_mbad6520.docx
Tenga en cuenta que el orden de las preguntas no sigue necesariamente el orden del artículo, y el material para responder algunas de las preguntas aparece en más de un lugar del artículo.
Evaluación
Esta tarea vale hasta 50 puntos. Se le evaluará en lo siguiente:
Grado en el que sus respuestas muestran evidencia de que se involucró y entendió las lecturas asignadas
Integridad de sus respuestas
Grado en que sus respuestas reflejan el pensamiento crítico
Preguntas
¿Cuáles son las diferencias clave entre el proceso de minería de datos adoptado por los autores del artículo (que se muestra en la Figura 1 del artículo) con el proceso CRISP-DM descrito en el libro de texto?
R: El proceso de flujo del libro consta de 6 pasos, mientras que el proceso de flujo de los artículos consta de un paso menos, es decir, de tan solo 5 pasos. Los mencionaré a continuación:
- Proceso de flujo CRISP-DM: Comprensión empresarial 🡪Comprensión de datos 🡪 Preparación de datos 🡪Modelado 🡪Evaluación 🡪Implementación
- Proceso de flujo del artículo: Definición de objetivos comerciales 🡪Almacén de datos 🡪Preparación de datos 🡪Modelado 🡪Toma de decisiones basadas en datos
Para ambos ciclos interactúa la regla antes que la excepción. El proceso es una exploración de datos. Por lo que pasar por el proceso sin antes haber resuelto el problema, habitualmente, no es un error. Por lo tanto, es de esperar que después de la primera interacción, los equipos de ciencia de datos poseen más conocimiento del proceso y el siguiente debiese estar más informado.
En mi opinión, las diferencias claves son que en el proceso de flujo del CRISP-DM posee un paso más, no así, el del proceso de flujo del artículo que reemplaza la “evaluación” y la “implementación” por un solo paso; la “toma de decisiones basadas en datos”. Pienso que el proceso de flujo del artículo es más eficiente al incluir un paso menos que el proceso de flujo CRISP-DM, ya que, después del modelado evalúa y evalúa las decisiones basadas en los datos obtenidos para ser aprobados o rechazados para finalmente determinar si el proceso tuvo éxito.
En su discusión sobre el proceso de minería de datos, ¿qué puntos clave enfatizados por los autores del artículo hacen eco de los puntos clave sobre el proceso realizado por los autores de DSFB?
R: Tanto los autores del artículo como los autores del libro hablan sobre la Preparación de Datos y Modelado; y sobre la Comprensión del Negocio y sus objetivos. La capacidad de supervisarse a sí mismo son gracias a las metas y objetivos comerciales propuestos; puntos que permiten otorgar un control relevante para evitar y disminuir sesgos. Por lo demás, las metas y objetivos propuestos proporcionan la capacidad de evaluar el desempeño de los empleados, y a su vez permiten a los empleados realizar una autoevaluación. Un aspecto importante a considerar para el negocio. Por otro lado, el modelado en la minería de datos permite a organismos gubernamentales realizar un análisis de datos financieros y de transacciones para transfórmalos en información útil. Otro aspecto relevante es la organización de minería de datos. Éstas permiten mejorar la planificación y toma de decisiones para generar nuevas fuentes de ingresos, obteniendo como resultado un mayor crecimiento de la organización.
¿Qué tipo de minería de datos estaban haciendo los autores del artículo, supervisada o no supervisada? Explica tu respuesta.
R: Los autores del artículo comentaron que en el estudio de caso la empresa se propuso de un objetivo en particular; desarrollar un modelo objetivo segmentado para determinar los mejores enfoques para el periódico y cuál sería el comportamiento de sus suscriptores. Si bien, tuvieron dificultades con la investigación, lograron crear buenas metas y objetivos para la empresa. Esto se conoce como Técnicas Supervisadas en minería de datos. Es primordial crear un variable objetivo idóneo y lograble para cumplir con el objetivo del negocio. De lo contrario, será difícil obtener resultados útiles y alineados con los objetivos comerciales del negocio.
¿Qué cree que quieren decir los autores del artículo cuando afirman en la página 273 que las empresas no deberían embarcarse en “proyectos” de minería de datos?
R: Los Autores del artículo, se refieren a que las empresas siempre deben definir objetivos claros y junto a esto poseer planes de acción cuando comience la minería de datos debido a que es fundamental no desperdiciar recursos o desarrollar proyectos de investigación sin razones ni datos para poder mejorar.
¿Por qué la fase de preparación de datos suele requerir una gran cantidad de tiempo y recursos? (Asegúrese de usar algunos detalles del artículo en su respuesta. Tenga en cuenta que los autores dividen la fase de preparación de datos CRISP-DM en almacenamiento de datos y preparación de datos).
R: La fase de preparación de datos en el artículo se estima que entre el 50 % y el 80 % del tiempo de un científico de datos se dedica a la preparación estos
Antes de comenzar un proyecto hay que definir qué datos se necesitan. La preparación de datos implica la limpieza y el formateo de datos, un proceso complicado que valida y corrige los datos antes del análisis. De hecho a mayoría de las veces, los atributos de una base de datos son diferentes de los de otra.
Los problemas que se visualizan en este conjunto de datos son:
...