TRABAJO INVESTIGATIVO 1 BUSINESS INTELLIGENCE
tramux117Ensayo15 de Agosto de 2020
2.861 Palabras (12 Páginas)157 Visitas
Learning Analytics
Christian David Ramírez Bejarano
Corporación Unificada Nacional CUN
Ingeniería de Sistemas
Business Inteligent II
Grupo: 30105
Bogotá D.C
Abril 2020
Tabla de contenido
ABSTRACT 3
PALABRAS CLAVE 3
INTRODUCCION 3
BASES DE DATOS 3
RECOPILACION DE LOS DATOS 4
PROCESADO DE DATOS 4
MINERÍA DE DATOS Y EVALUACIÓN 5
RESULTADOS Y DISCUSIÓN 5
PRAGMATISM Y SOLUCIÓN DE PROBLEMAS CON ESTUDIANTES 6
SUPUESTOS EXCESIVAMENTE SIMPLIFICADA 7
CUESTIONES DE DESARROLLO 7
ANALISIS DE LA RECOLECCION 7
COMPORTAMIENTO Y COMPILACION 8
CONCLUSIONES 9
REFERENCIAS 9
LEARNING ANALYTICS[pic 3]
[pic 4]
Learning analytics are rapidly being implemented in different educational settings, often without the guidance of a research base. Vendors incorporate analytics practices, models, and algorithms from datamining, business intelligence, and the emerging “big data” fields. Researchers, in contrast, have built up a substantial base of techniques for analyzing discourse, social networks, sentiments, predictive models, and in semantic content (i.e., “intelligent” curriculum). In spite of the currently limited knowledge exchange and dialogue between researchers, vendors, and practitioners, existing learning analytics implementations indicate significant potential for generating novel insight into learning and vital educational practices. This paper presents an integrated and holistic vision for advancing learning analytics as a research discipline and a domain of practices. Potential areas of collaboration and overlap are presented with the intent of increasing the impact of analytics on teaching, learning, and the education system.
[pic 5]
Modelo Predictivo, Data-mining, Modelos de aprendizaje, Resolver conflictos
Learning Analytics (LA) es un concepto joven y en desarrollo. La reflexión se justifica sobre la manera de posicionar los primeros desarrollos de viabilidad a largo plazo y el impacto positivo de LA en el aprendizaje y la enseñanza. De importancia crítica se incrementa el diálogo entre investigadores y profesionales a fin de orientar el desarrollo de nuevas herramientas y técnicas para el análisis. La minería de datos aplicada a la educación o minería de datos educativos (Educational Data Mining, EDM) surge como un paradigma orientado al diseño, tareas, métodos y algoritmos con el Bpropósito de descubrir conocimiento y patrones dentro de los datos, y realizar predicciones de resultados o comportamientos de los estudiantes ballesteros y Sánchez, 2013; Luan, 2002).
No está claro en este momento si LA desarrollará como un campo de estudio o si las técnicas de análisis serán subsumidos en los campos de investigación existentes. Independientemente de la trayectoria a largo plazo de LA, una base de investigación que ya se está desarrollando rápidamente.
[pic 6]
[pic 7]
Fig.1
La primera etapa del proceso KDD (Fig.1) es la recopilación de datos, en la cual se determina el tipo de fuentes de información y la manera de conseguirla. La siguiente etapa es el pre-procesado, en la cual los datos originales se transforman a una forma más adecuada para ser utilizados por la técnica de minería de datos en particular. Posteriormente, sigue la etapa de minería de datos en la
que define el tipo de tarea a realizar y el algoritmo a implementar. A continuación, está la etapa de evaluación, en donde se determina la validez y confiabilidad de los patrones obtenidos, los cuales representan el conocimiento extraído. Finalmente, se encuentra la etapa de difusión y uso, en la que se hace partícipe a los usuarios del conocimiento obtenido. En la siguiente sección se presenta la técnica de minería utilizada en esta investigación.
La metodología empleada se basa en los pasos típicos del proceso KDD y se muestra esquemáticamente (Fig.2)
[pic 8]
Fig.2
[pic 9]
La muestra de datos corresponde a 306 estudiantes de 7 cursos del primer y segundo semestre de ingeniería de una institución perteneciente al Instituto Politécnico Nacional. Es importante
destacar, que con una cantidad parecida de registros, el Algoritmo Bayes Ingenuo(Fig.3) ha obtenido una exactitud parecida o superior a otras técnicas de minería de datos en trabajos similares (Kotsiantis et al., 2003; Osma begov ć y Sul ć 20 2; Mueen, Zafar y Manzoor, 2016). La información de aprobación y reprobación de los estudiantes fue proporcionada por los docentes de la institución y las demás variables o atributos asociados al rendimiento académico fueron recopilados por medio de una encuesta a los estudiantes. Todos los datos fueron integrados en una tabla en formato
electrónico.
[pic 10]
Fig.3
[pic 11]
En esta etapa se transforman los datos de tal forma que puedan ser manipulados por la técnica de minería de datos a utilizar. Para esto, los atributos que no eran categóricos se les asignaron valores
nominales como se muestra en la Tabla 1. De esta manera se dispone de una tabla de 306 registros de estudiantes (filas) y 21 at butos (columnas) de los cuales el “aprueba” define la etiqueta de la clase. Verá la función AutoREST en acción en "Crear un Servicio RESTful en la base de datos "más adelante en este artículo. Luego, en la sección "Personalizar el filtrado de consultas en el lado de la base de datos", verá un ejemplo de cómo el enfoque basado en el uso de SQL
o PL / SQL para crear manualmente manejadores de recursos puede ser[pic 12]
implementado, ilustrando cómo puede empujar los datos de su aplicación
operaciones de manipulación más cercanas a los datos. Atributos de los estudiantes con sus posibles valores.
(Fig.4)
[pic 13]
Fig.4
El conjunto de datos obtenido tiene un desbalanceo de clases considerable; es decir, el número de registros de estudiantes de una clase es mucho mayor (clase mayoritaria) que el número registros de la otra clase (clase minoritaria). En este caso, de 306 estudiantes, 256 aprobaron y 50
reprobaron. El problema de utilizar datos demasiado desbalanceados es que la técnica de minería de datos a utilizar tiende a clasificar los datos de prueba con baja sensibilidad a los elementos de la
clase minoritaria. Una forma de resolver este problema es haciendo un sobre muestreo o balanceo de la distribución de clases mediante el muestreo aleatorio estratificado (Hernández et al., 2004),
el cual consiste en adicionar muestras aleatorias de las clases mayoritarias en las clases minoritarias.
Una vez realizadas las tareas de preprocesado en la sección anterior, se obtienen los datos que servirán de entrenamiento para aplicarles la técnica predictiva de minería de datos y construir el modelo. En este trabajo, la tarea predictiva empleada es la clasificación y la técnica utilizada es el Algoritmo Bayes Ingenuo debido a su uso y efectividad en la exactitud de las predicciones con
cantidades de datos de entrenamiento similares a las utilizadas en este estudio (Shahiri et al., 2015; Kavipriya, 2016).
En la siguiente sección se describen los experimentos realizados para la obtención de los modelos de predicción de probación de los estudiantes al final del semestre.
[pic 14]
Para cada experimento de esta sección, se evalúa el modelo predictivo por medio del cálculo de la exactitud de las predicciones (porcentaje de la cantidad de registros con predicciones correctas entre el total de registros), utilizando el método conocido como validación cruzada (Hernández et al., 2004). Este método consiste en dividir aleatoriamente el total de los datos de entrenamiento. En este trabajo, se dividió en dos conjuntos equitativos. Se construye un modelo con el primer conjunto y se usa para predecir los resultados en el segundo conjunto para calcular su exactitud. Después, se construye un modelo con el segundo conjunto y se usa para predecir los resultados del primer conjunto para calcular su exactitud. Finalmente, se calcula la exactitud del modelo construido, promediando las exactitudes calculadas anteriormente. El propósito de los experimentos es seleccionar la mayor cantidad de atributos que propicien el
...