ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Documentacion IA


Enviado por   •  14 de Septiembre de 2020  •  Documentos de Investigación  •  1.936 Palabras (8 Páginas)  •  204 Visitas

Página 1 de 8

Reconocimiento de cuadrados en tiempo real

archivo0w@gmail.com

galletaf5@gmail.com

viox24@gmail.com

Abstract— Este documento presenta el proyecto de reconocimiento de cuadrados en tiempo real, con base al tratamiento de imágenes y con ayuda de la librería de OPENCV para la materia de inteligencia artificial.

  1. INTRODUCCIÓN

Un subcampo de la Inteligencia Artificial es la llamada Visión Artificial, la cual es la encargada de programar una computadora para que "entienda" una escena o las características de una imagen. Una de las aplicaciones más relevantes del visón artificial es la detección de imágenes, no obstante, tiene más aplicaciones que se usan en diversas áreas de la vida.

La visión artificial hace uso  del reconocimiento de patrones, aprendizaje estadístico, geometría de proyección, procesamiento de imágenes, teoría de grafos y otros campos para poder obtener los objetivos de su aplicación.

Dentro de esas aplicaciones está el reconocimiento de objetos con ayuda del procesamiento de imágenes, que han ayudado a facilitar las actividades humanas de una manera sorprendente. El área que abarcamos en el presente documento es la educación, pues han existido un sin número de aplicaciones que ayudan a optimizar esta área y aun hacen falta más.

Aquí mostramos un ejemplo de la aplicación de estas características que tiene la visión artificial mediante un proyecto encargado de reconocer una figura geométrica y distinguirla del resto de lo que la cámara capta, esto también mediante el reconocimiento de patrones, después de procesar la imagen de manera adecuada.

Se presenta la manera en como llevamos a cabo el proyecto, sus objetivos y la justificación del mismo, así como también todos aquellos pasos que tuvimos que realizar para que dichos objetivos se cumplieran.

  1. DESARROLLO DE CONTENIDOS

  1. Objetivo General

Implementar una aplicacion capaz de identificar el cuadrado de las demás figuras geométricas y otros objetos captados en tiempo real.

  1. Objetivos Específicos
  • Captar la imagen de la videocámara.
  • Extraer los colores RGB de la imagen captada.
  • Convertir la imagen a escala de grises.
  • Obtener un histograma de la escala de grises.
  • Obtener un umbral óptimo para separar pixeles en blanco y negro.
  • Binarizar la imagen.
  • Segmentar la imagen y etiquetar secciones.
  • Obtener área y perímetro de cada objeto recocido en la segmentación.
  • Obtener el factor de compresión del cuadrado con el entrenamiento de varias imágenes.
  • Comparar las características obtenidas del cuadrado con diferentes figuras u objetos para su reconocimiento.

  1. Justificación

Al paso del tiempo se han creado muchos artefactos e incluso sistemas expertos para ayudar a la educación de los niños, con base a esto se decidió crear el proyecto de reconocimiento de cuadrados como primera instancia, pensando en expandir este proyecto para que reconozca todas las figuras y así poder constituir un sistemas que pueda ayudar a los adultos y niños a aprender el nombre de las figuras y las formas que tiene cada uno.

  1. Descripción del Proyecto

La aplicación consiste en reconocer los cuadrados de las demás figuras u objetos que se visualizan en tiempo real mediante la cámara de la computadora.

Después de realizar el procesamiento de las imágenes da como resultado el que esta aplicación es capaz identificar los cuadrados poniendo en ellos un círculo rojo. Es decir el pequeño círculo rojo solo se pondrá en una de las esquinas de aquellas figuras que solo son un cuadrado dejando a un lado todo aquello que no lo es.

Para un correcto funcionamiento de la aplicación es importante contar con un fondo en blanco y que las imágenes que se muestren sean de color oscuro, este tipo de detalles se están perfeccionando.

La aplicación también tiene la opción de poder eliminar absolutamente todo el ruido es decir que la cámara no muestre nada en la imagen binaria más que solo un cuadro cuando este se detecte.

  1. Herramientas Utilizadas

Las herramientas que utilizamos fueron las siguientes:

  • Cámara de la computadora
  • Zinjai- ID para escribir código en C++
  • Librería OpenCV

  1. Desarrollo del Programa

Todo el proyecto fue realizado en lenguaje C++ con ayuda le la librería de OpenCV.

OpenCV (Open source Computer Vision library) es una librería abierta desarrollado por Intel. Esta librería proporciona un alto nivel funciones para el procesado de imágenes.

Para iniciar comenzamos con el tratamiento de imágenes, para después poder aplicar los mismos procesos a lo que la cámara capta.

  1. Obtención de Colores RGB

La función imagen.at(i, j) de la librería de OpenCV nos regresa el vector de cada pixel de la imagen en proceso en el siguiente orden [azul, verde, rojo] (B, G, R). Una vez obtenidos esos vectores podemos separarlos en diferentes matrices.

  1. Conversión de la Imagen a Escala de Grises

Una vez que tenemos los valores en RGB es simple pasarlo a escala de grises con una suma de estos tres valores y dividirlo entre tres, este nuevo valor será el que le corresponda a ese pixel pero en la nueva matriz de grises.

  1. Histograma

El histograma se obtiene de la matriz de la escala de grises, realizando el conteo de cuantas veces aparece un color en la matriz que tiene 256 valores que van del 0 al 255.

  1. Umbral Optimo

El umbral es el punto del histograma en cual se empezaran a cambiar los colores de la escala de grises solo en blanco y negro. Utilizamos un umbral fijo de 80.

  1. Binarizacion

Es aquí en donde hacemos uso del umbral, a partir de este punto los pixeles que tienen menos de ese valor serán convertidos en negro es decir valor 0  y los mayores a 80 se convierten en 1 el cual equivale al blanco, para poder mostrar esta matriz como tal en una imagen real el 1 se convierte en 255.

[pic 1]

Fig. 1. Imagen binarizada y su matriz.

...

Descargar como (para miembros actualizados) txt (12 Kb) pdf (1 Mb) docx (2 Mb)
Leer 7 páginas más »
Disponible sólo en Clubensayos.com