Detección de movimiento por medio de visión artificial
Enviado por Sebastián Herrera Peña • 1 de Diciembre de 2022 • Informe • 996 Palabras (4 Páginas) • 58 Visitas
[pic 1][pic 2]
artificial
Germán Andrés Charfuelán G. Sebastián Herrera
Alexander Garzón
Base Fundamental (Visión Humana)
[pic 3]
Primero, la luz pasa a través de la córnea (la capa frontal transparente del ojo). La córnea tiene forma de cúpula y desvía la luz para ayudar al ojo a enfocar. Parte de esta luz entra en el ojo a través de una abertura llamada pupila. El iris (la parte coloreada del ojo) controla la cantidad de luz que deja entrar la pupila.
A continuación, la luz pasa a través del lente o cristalino (una parte interior transparente del ojo). El cristalino trabaja junto con la córnea para enfocar la luz correctamente en la retina. Cuando la luz llega a la retina (una capa de tejido sensible a la luz en la parte posterior del ojo), células especiales llamadas fotorreceptores denominados bastones y conos agrupados en estructuras, existiendo dentro de estas estructuras, secciones sensibles a cada uno de los tres colores básicos del RGB que convierten la luz en señales eléctricas.
Estas señales eléctricas viajan desde la retina a través del nervio óptico hasta el cerebro. Luego, el cerebro convierte las señales en las imágenes que vemos.
¿Qué es visión computacional?
La fantasía de que una máquina es capaz de simular el sistema visual humano es antigua. Hemos recorrido un largo camino desde que aparecieron los primeros trabajos universitarios en la década de 1960, como lo demuestra la llegada de los sistemas modernos integrados en las aplicaciones móviles.
Con el surgimiento de las computadoras en la década de los cincuenta, se genera al interior de la comunidad científica el interrogante relacionado con la posibilidad de enseñar a las computadoras a realizar tareas comúnmente
asociadas con la inteligencia humana, entre las cuales se encuentra la capacidad de resolver problemas, comprender lenguajes o analizar información visual. Dando origen con ello a una disciplina orientada a emular la inteligencia humana, denominada Inteligencia Artificial (IA)
Hoy en día, la Visión Computacional (VC) es uno de los subcampos más importantes de IA y Machine Learning (ML), dada su amplia variedad de aplicaciones y su tremendo potencial.
La VC es el subcampo de la IA que intenta imitar las capacidades de la visión humana. Y por visión humana no nos referimos solo a los ojos o a la capacidad de ver imágenes. El propósito no es imitar solo la vista, sino imitar la percepción, la capacidad de dar sentido a lo que los humanos vemos. La VC se centra en la creación de sistemas digitales que pueden procesar, analizar y dar sentido a imágenes o videos, de la misma manera que los humanos.
El concepto de VC se basa en enseñar a los computadores a procesar una imagen a nivel de píxel por píxel y entenderla. Los algoritmos que se utilizan se basan en el reconocimiento de patrones. Se entrenan los computadores con una gran cantidad de datos para que puedan procesar las imágenes, se etiquetan los objetos en ellos y se encuentran patrones. Por ejemplo, si enviamos un millón de imágenes de flores, la computadora las analizará e identificará patrones que son similares en todas las flores y creará un modelo que será capaz de detectar con precisión si una imagen aleatoria es una flor.
Aplicación del álgebra lineal en la detección y procesamiento de imágenes
El procesamiento de imágenes se define como el uso de operaciones matemáticas aplicadas a una imagen con el propósito de mejorarla en algún sentido u obtener parámetros. El procesamiento se realiza por medio de algoritmos gráficos aplicados a las imágenes mediante un proceso de digitalización.
El uso de estas técnicas se extiende a muchos campos de la ciencia y la tecnología. Algunos de estos son: la medicina, la robótica, visión artificial, reconocimiento de patrones, entre otros. Para el álgebra lineal se utilizan
...