ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

INTELIGENCIA DE NEGOCIOS


Enviado por   •  17 de Julio de 2021  •  Informe  •  879 Palabras (4 Páginas)  •  97 Visitas

Página 1 de 4

INTELIGENCIA DE NEGOCIOS

EAP de Ingeniería de Sistemas

UNMSM

APELLIDOS Y NOMBRES: CCORAHUA MIRAMIRA JOHN WILLIAN                                          CÓDIGO: 15200048


EXAMEN PARCIAL

12/07/2021

  1. Respecto a su Proyecto
  1. Desde una perspectiva basada en el proceso KDD, identificar y describir las  actividades correspondientes a cada fase. Especifique niveles de granularidad.

DESCRIPCIÓN DE FASES Y ACTIVIDADES

 1. Selección

-Elección de la fuente de datos:

Se evaluará, analizará y escogerá la mejor opción en la recolección de fuentes tanto como la herramienta a usar en dicha etapa (Excel, Access, BBDD).

-Recolectar los datos de los alumnos matriculados por cada sección y curso:

Se recolectarán datos que relacionan características personales, socioeconómicas y académicas de los alumnos matriculados

-Seleccionar las variables relevantes:

Buscaremos las variables que generan mayor aporte, entre ellos puede ser índice económico, ponderado del alumno, entre otros.

-Realizar muestreo de datos:

Realizaremos una descripción básica a nivel estadístico: valores medios máximos, mínimos y desviaciones; esto nos dará una foto inicial precisa del conjunto de datos sin tener que recurrir a inspeccionar visualmente todas las filas

6.2. Depuración

La etapa de pre procesamiento es la etapa que consume gran parte del tiempo, requiere de un análisis detallado ya que asegurar la calidad de los datos nunca será una tarea fácil

 -Completar datos nulos: Ante la existencia de datos nulos, se generará un mini-proceso en la cual se evitarán dichos datos nulos del análisis.

-Reemplazar datos incorrectos: Se crearán varios mini procesos para auto-corrección de datos ya sea por formato, semántica, etc. -Modificar datos atípicos: Se deberá encontrar los valores extremos de los datasets, los máximos y mínimos, con algún método exploratorio para luego reemplazar los datos atípicos con datos adecuados a la desviación típica del dataset -Eliminar redundancias: Eliminar dentro de los datasets valores que sean redundantes o repetidos mediante un método completo. 6.3. Transformación -Representación de datos: Se debe reemplazar los conjuntos de datos por otros conjuntos de datos que cumplan con estándares enfocados hacia los objetivos; con los nuevos conjuntos de datos “estandarizados” se podrá trabajar de manera más eficiente y productiva. -Construcción de atributos para facilitar la minería de datos: Es necesario crear nuevos atributos como promedio de alumno, promedio de notas por curso, promedio de notas por edades, promedio de notas por sección, promedio de notas por profesor, etc. para obtener información útil con la minería de datos más fácilmente; esta actividad también es llamada agregación de datos. -Identificar características comunes Identificar las características o atributos comunes en los estudiantes para luego agruparlos. -Normalización de los datos Se buscan nuevas redundancias buscando evitar la repetición de datos creando relaciones entre tablas . 6.4. Minería de datos -Selección de algoritmo de Minería de Datos: La tarea de minería de datos será la clasificación y para su realización se utilizará la técnica de Árboles de Decisión. La aplicación de nuevas técnicas de minería de datos como Clúster o Red neuronal se pueden convertir en una alternativa para descubrir segmentos de poblaciones o relaciones que no se puedan encontrar con la técnica de Árboles de Decisión. -Implementación de algoritmos de Minería de Datos: Se utilizará software de data mining como WEKA, Orange y KNIME -Regresión lineal para obtener rendimientos: Otras técnicas de análisis de datos empleadas serán la regresión lineal múltiple y la regresión logística para detectar las variables que mejor permiten predecir el éxito/fracaso académico -Clustering: Este método de minería de datos, la usaremos para la segmentación de alumnos de acuerdo a su desempeño académico. 6.5. Validación de Modelo En esta fase se evaluarán los patrones descubiertos con el fin de determinar su validez, remover los patrones redundantes o irrelevantes y traducir los patrones útiles en términos que sean entendibles para el usuario -Probar la concordancia entre el desempeño del modelo y el desempeño del sistema real: Se realiza una comparación usando datos de prueba. -Evaluar un modelo que se ajuste a los datos: 6.6. Visualización -Mostrar rendimiento en gráfica de barras: Los gráficos de barras serán muy útiles en este caso ya que se deberá representar muchos atributos cualitativos y cuantitativos discretos -Gráfico de escala de tiempo: -Histograma: La necesidad de representar los datos tablas de frecuencias obtenidas conducirá al uso de histogramas. Un claro ejemplo de su uso puede ser la visualización de las frecuencias de determinadas calificaciones obtenidas por los estudiantes. -Vista circular: Útil para comparar datos; generalmente trabajan con porcentajes. Esta representación es conveniente en este caso ya que hay varias secciones y grupos bien diferenciados. -Mostrar gráfico de predicción: 6.7. Evaluación de Resultados -Evaluación de los patrones: En este punto se verifica la calidad de los patrones resultantes. Idealmente, los patrones descubiertos deben de tener tres cualidades: ser precisos, comprensibles e interesantes, es decir, útiles y novedosos. -Interpretación de los patrones: Con esta actividad se obtiene conocimiento para generar e incluir estrategias alineadas con la visión y los objetivos, los cuales podrían estar encaminados en la intervención de la vida académica de los estudiantes que se perfilan como potenciales desertores

...

Descargar como (para miembros actualizados) txt (6 Kb) pdf (72 Kb) docx (9 Kb)
Leer 3 páginas más »
Disponible sólo en Clubensayos.com