DESARROLLO DE UNA SOLUCIÓN DE RECOMENDACIÓN CON AZURE MÁQUINA DE APRENDIZAJE
Enviado por Andres Mantilla • 19 de Noviembre de 2017 • Práctica o problema • 865 Palabras (4 Páginas) • 117 Visitas
DESARROLLO DE UNA SOLUCIÓN DE RECOMENDACIÓN CON AZURE MÁQUINA DE APRENDIZAJE
[pic 1]
PRESENTADO POR
DANIEL ANDRES MANTILLA SALAZAR
UNIVERSIDAD DE CUNDINAMARCA
FACULTAD DE INGENIERIA
PROGRAMA DE INGENIERIA SISTEMAS
INTELIGENCIA ARTIFICAL
FUSAGASUGÁ 30 DE MAYO 2015
Análisis proceso de diseño
- Se crea un experimento en blanco, para hacer el desarrollo del proyecto del sistema de recomendación de películas de cine; en este colocamos el nombre de Movie recommendation.
[pic 2]
- Movie ratings es el repositorio que se utiliza para la realización del proyecto, en el cual se encuentran los datos relevantes para diseñar un sistema de recomendación basado en las diferentes características que las películas poseen y en el cual se contienen.[pic 3]
- Ahora creamos una selección de columnas y la unimos con el repositorio, esto implica que las columnas de las cuales hagamos uso serán relevantes para la búsqueda de recomendaciones específicas; para esto seleccionamos todas las columnas del repositorio excepto la fecha y la hora que en este caso no es determinante para generar una recomendación.
En este caso nuestras columnas determinantes son el id del usuario (user id), el id de la película (Movie id) y la clasificación de la película (Rating).
[pic 4]
[pic 5]
- Al arrastrar el Split lo unimos con la selección de columnas que realizamos en el paso anterior, esto con el fin de hacer uso delos datos que en estas se encuentran. Continuando se dividen los datos en dos aspectos, uno es el Tren de datos que se usa para realizar las predicciones y por otra parte los Datos de prueba que servirán para la validación que haga el recomendador.
Finalmente debemos elegir una cantidad decimal entre 0 y 1, que nos determinara la cantidad de columnas que vamos a tomar en cuenta para el sistema de recomendación, en este caso es un 0.7 lo cual implica que se hace uso de un 70% de las columnas 70:30 con un conjunto de columnas del 70% y un 30% de sus datos. [pic 6]
- Arrastramos Train Matchbox Recommender quien aprende de los datos teniendo en cuenta que será primordial la observación y los gustos de los usuarios, frente a la clasificación del contenido y puntajes de la película y asi relaizar una mejor recomendacion.[pic 7]
- Para terminar la predicción del paso anterior debemos tener en cuenta el puntaje que las personas dan a estos aspectos relevantes, por lo cual añadimos un the Score Matchbox Recommender, con esto se entiende que si una película es muchas veces vista, tendrá un puntaje mayor ante otras, lo cual dara una medida de recomendación para el usuario, por otra parte los gustos de genero de cierta persona pueden servir de recomendación teniendo también un puntaje personal que puede dar a una película.[pic 8]
- Aquí añadimos un Evaluate recomender, que sirve para dar una exactitud a la evaluación de los datos o predicciones obtenidas, en este momento podemos correr el proyecto y generar una vista a una de las tablas generadas.
[pic 9]
Para visualizar la tabla damos cli derecho sobre score matchbox recomender luego en la opción score dataset y por último en visualize en donde nos arrojara la siguiente tabla.[pic 10]
En este caso los datos aun no son relevantes para la búsqueda, ya que necesitamos el nombre de la película para una predicción más específica, su id no es tan relevante para esto.
- Para hacer una búsqueda más exacta buscamos el repositorio que contiene los títulos de las películas, así podremos ver un puntaje por película teniendo en cuenta su nombre; para esto agregamos el IMDB movie titles, que contiene la relación de títulos con id de las películas; para determinar esto y llegar a una visualización necesitamos agregar un edit metadata quien nos determina el conjunto de datos que tomaremos de las columnas.
Finalmente para poder unir nuestro proyecto totalmente con las demás instancias hechas anteriormente, debemos crear dos join, el primero realiza una consulta del ítem 1 y El id de la película y el segundo El ítem 1 con el nombre o título de la película, asi nos generara la siguiente tabla donde podremos analizar las recomendaciones de una manera más predictiva y eficaz.
...