ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

DEEP LEARNING EN EL RECONOCIMIENTO FACIAL


Enviado por   •  19 de Agosto de 2021  •  Trabajo  •  5.660 Palabras (23 Páginas)  •  96 Visitas

Página 1 de 23

DEEP LEARNING EN EL RECONOCIMIENTO FACIAL.

Autor

Juan David Trujillo Suarez

Tutor

Ferley Medina Rojas

Universidad Surcolombiana, Ingeniería de Software.

u20172161632@usco.edu.co

Resumen  El reconocimiento facial es una aplicación de la vision artificial la cual busca identificar una persona en una imagen digital, esto es posible mediante la aplicación de una serie de técnicas para extraer características claves del sujeto en la imagen y compararlas con una base de datos. En este artículo se propone encontrar y utilizar los dos algoritmos de Deep learning más populares y eficaces para el reconocimiento facial de la actualidad. Estos fueron el Algoritmo clasificador en Cascada de Haar y el modelo VGG16 para redes neuronales convolucionales.

Inicialmente haciendo uso de únicamente el Algoritmo Clasificador de Haar se obtuvo una precisión por debajo del 50%, pero, una vez implementado el modelo VGG16 en conjunto con este se alcanzó una precisión por encima de la esperada con un valor de 97.67%.

Abstract  Facial recognition is an application of artificial vision which seeks to identify a person in a digital image, this by applying techniques to extract key characteristics of the subject in the image and compare them with a database. This article proposes to find and use the two most popular and effective deep learning algorithms currently available for facial recognition. These were the Haar Cascade Classification Algorithm and the VGG16 model for convolutional neural networks.

Initially using only the Haar Classification Algorithm, a lower accuracy than expected was obtained, however, once the VGG16 model was implemented in conjunction with it, a higher accuracy than expected was achieved with a value of 97.67%.

Palabras Clave  Algoritmo clasificador de Haar, Reconocimiento facial, Redes neuronales, Vision artificial, VGG16.

Keywords — Facial recognition, Haar cascade algorithm, Machine Vision, Neural networks, VGG16.

  1. INTRODUCCION

El reconocimiento facial es una aplicación de la Vision Artificial la cual busca identificar rostros humanos, Woodrow Wilson Bledsoe puede considerarse como el pionero de esta tecnología, ya que en 1960 realizo un sistema para clasificas los rasgos humanos a través de la tabla RAND. Esta consiste en una tabla de números aleatorios la cual utiliza simulación electrónica de una ruleta conectada a un ordenador. Para realizar la detección facial se utilizaba un lápiz óptico y unas coordenadas para situar los ojos, la nariz o la boca de las personas de forma precisa, sin embargo, este proceso era un procedimiento muy manual. Una década después surgió la aplicación de marcadores faciales, estructurado por Goldstein, Harmon y Lesk estos situaron 21 marcadores subjetivos específicos, este proceso al igual que el de Bledsoe era muy manual.

En el 2001, nace el Viola-Jones Object Detection Framework, el cual propone algoritmos para detectar objetos dentro de las imágenes (entre estos rostros humanos) los cuales más adelante fueron utilizados para la detección de rostros de forma satisfactoria. Dentro de este se encuentra el algoritmo clasificador de Haar, el cual mediante una imagen integral busca rasgos en los rostros humanos, estos rasgos por lo general son puntos clave en la nariz, boca y frente. En la década actual para lograr una mayor precisión a la hora de realizar la detección facial, se hizo aplicación de las redes neuronales convolucionales, esta se compone de una serie de capas las cuales cuentan por lo general con funciones de activación, perdida y optimización. El reconocimiento facial en el presente proyecto fue posible aplicando en conjunto las técnicas de Viola-Jones y las redes neuronales convolucionales.

Para aplicar estos algoritmos se hizo uso adicionalmente del modelo VGG16 para redes neuronales convolucionales, este modelo se utilizó al ser uno de los más precisos a la hora de hacer el reconocimiento facial. En el presente artículo se explicarán y utilizarán en conjunto los algoritmos mencionados anteriormente.

  1. ESTADO DEL ARTE

A. Alta precisión usando clasificador en cascada.

  1. Preeti Singh y Mukesh Tripathi (2013) abarcaron el problema de la detección facial en imágenes con fondos simples y complejos, las cuales con el uso del clasificador haar cascade lograron realizar tareas de reconocimiento facial. Se establece dicho algoritmo como uno de los más rápidos y seguros para tareas de Vision Artificial, ya que se basa en reconocer características de Haar, estas características se empiezan analizando en la imagen desde la esquina superior izquierda hasta la esquina inferior derecha. Los experimentos se hicieron con una base de datos de Rostros Indios (IFD por sus siglas en ingles) y con un dataset de Caltech. Todas las imágenes

.

presentes fueron de la parte frontal del rostro. Además de esto, utilizaron OpenCV para implementar el clasificador. Como resultados obtuvieron un 100% de precisión con la base de datos de rostros Indios y 93.24% de precisión con el dataset de Caltech.

B. Automatización de verificación de asistencia a el trabajo.

  1. J. G. RoshanTharanga, S. M. S. C. Samarakoon, T. A. P. Karunarathne 2, K. L. P. M. Liyanage, M. P. A. W. Gamage, D. Perera (2013) plantearon en este proyecto una solución a una empresa, la cual requería conocer y mantener un registro organizado de la asistencia al trabajo, todo esto fue posible mediante el uso de Reconocimiento Facial en tiempo real. Para esto fue implementado el algoritmo para detectar rasgos faciales conocido como Haar Cascade al ser uno de los más simples y rápidos para realizar tareas de reconocimiento facial manteniendo su alta precisión a pesar de su rapidez de cálculo. Para este sistema se basaron en computación en la web, ya que de esta forma se estarían descargando y subiendo datos óptimamente a la base de datos, el proceso que realizaba la aplicación resumidamente consistía en lo siguiente: Se captaba el fotograma a través de la cámara, este fotograma debía ser analizado para detectar las caras inicialmente, para luego esta ser comparada en tiempo real con los datos ya entrenados almacenados en la nube, los cuales se encontraban guardados en una base de datos, la cual para ser ingresada se ejecutaban sentencias SQL, para luego comparar cada imagen e identificar al empleado determinado, finalmente se devolvía un estado de asistencia en la pantalla y se mostraban los detalles del empleado en ella.

  1. Reconocimiento facial en tiempo real utilizando los algoritmos LBPH y el algoritmo de Viola y Jones.
  1. Suma S L (2018) implemento un algoritmo de reconocimiento facial en tiempo real utilizando un Histograma de patrón binario lineal y el algoritmo de Viola Jones. Este método consistía en la fusión y reconocimiento de la comunicación. La extracción de características faciales mediante la técnica LBPH y clasificadores euclidianos utilizados para la detección facial. Este trabajo obtuvo un rango de precisión de entre 85% a 95%, este dependiendo de la luminosidad, casos en los que se presentan gemelos, personas con vello facial y/o personas utilizando anteojos.
  1. Clasificador en cascada de haar combinado con emparejamiento de bordes.
  1. Souhail Guennouni implementó en el 2017 un sistema de detección de rostros agrupando métodos como “Haar Cascade Classifier” y emparejamiento de bordes. El algoritmo de emparejamiento de bordes y la selección de características similares a las de Haar, combinadas con clasificadores de Haar son las dos técnicas utilizadas en este sistema. Este algoritmo produce un mejor emparejamiento, pero la velocidad de detección es comparativamente menor.

2

E. CNN para el reconocimiento facial.

[5]V. Mohanraj, S. Sibí, y V. Viadehi (2019) plantearon un reconocimiento facial basado en un conjunto de redes neuronales convolucionales (ECNN). El modelo propuesto aborda los desafíos de la expresión facial, el envejecimiento, la baja resolución y las variaciones de pose. El modelo ECNN propuesto supera a los modelos de vanguardia existentes, como los modelos Inception-v3, VGG16, VGG19, Xception y ResNet50 CNN con una precisión de rango 5 de 97.12% en el conjunto de datos de Web Face y 100% en el conjunto de datos de cara de YouTube.

...

Descargar como (para miembros actualizados) txt (37 Kb) pdf (313 Kb) docx (589 Kb)
Leer 22 páginas más »
Disponible sólo en Clubensayos.com