Visión artificial
Enviado por shirley dayann duarte rincon • 20 de Agosto de 2015 • Documentos de Investigación • 4.635 Palabras (19 Páginas) • 256 Visitas
ESTADO DEL ARTE.
Este documento pretende introducir a los métodos propuestos para la detección y seguimiento de la línea del carril identificando las contribuciones más significativas.
Para el análisis del entorno de la carretera es necesario hacer una rectificación del plano que permite eliminar la perspectiva de la imagen. Los beneficios de esto conlleva a que las líneas de la carretera tiendan a ser paralelas, que los carriles aparezcan con un ancho uniforme y que puedan estimarse las distancias entre los puntos sobre el plano de la carretera haciendo más fácil el análisis de la curvatura en la carretera.
En la Figura 1 (a) se muestra la imagen original capturada desde una cámara en una autopista, en la Figura 1 (b) se observa la transformación proyectiva de la imagen denominada también cómo homografía del plano, mapeo de perspectiva inversa (IPM), visión de pájaro (bird’s –eye view) o visión fronto-paralela .
La técnica de perspectiva inversa fue usada previamente por Bertozzi , el cual utilizó las características de la cámara como lo son la apertura y la resolución. Además de esto, tuvo en cuenta la calibración de la cámara en un ambiente fijo, controlando la dirección de visualización y el punto de vista. Todo esto combinado con técnicas básicas de visión estéreo que pueden ser divididas en cuatro pasos:
• Calibración del sistema de visión.
• Localización de una característica en una imagen.
• Identificación y localización de la misma característica en la otra imagen.
• Reconstrucción de la escena en tres dimensiones.
Tan concluye que la principal motivación de Bertozzi fue la detección de obstáculos, demostrando adicionalmente que el IPM también puede llegar a ser útil para la detección de carril. Asimismo Bertozzi plantea que el IPM puede de manera realista ser integrado en una aplicación de ayuda al conductor por implementación en hardware, mostrando cuán rápido puede ser el proceso de reasignación de puntos para obtener el IPM.
Sin embargo, Tan se enfoca en la detección de flujo óptico, partiendo en que el IPM simplifica el problema de la segmentación de este, siendo muy útil en situaciones prácticas al enfatizar en las medidas cuantitativas del flujo óptico.
Figura 1. Proceso de segmentación de una imagen. (a) Plano de la carretera. (b) Plano con ajuste de perspectiva.
Fuente: NIETO, Marcos; LABORDA, Jon Arróspide; SALGADO, Luis. Road environment modeling using robust perspective analysis and recursive Bayesian segmentation. (Segmentation Process).
Aly asume una carretera plana y concuerda con Bertozzi en el uso de las características de la cámara para hallar el IPM. Estas características las divide en intrínsecas (distancia focal y centro óptico) y extrínsecas (ángulo pitch, ángulo yaw y altura sobre el suelo). Del mismo modo asume que el sistema de coordenadas de la cámara está en el sistema de coordenadas del “mundo” como se muestra en la Figura 2. El cual esta desplazado a una altura H, a una rotación en el ángulo pitch (rotación con respecto al eje X) y en el ángulo yaw (rotación con respecto al eje Y). El ángulo roll (rotación con respecto al eje Z) no se asume, suponiendo que la cámara este correctamente instalada, lo que conlleva a que este ángulo sea cero.
Empezando por algún punto en el plano de la imagen, se obtienen las coordenadas del frame y se re-escala su proyección sobre la carretera, la cual es encontrada aplicando una transformación homogénea del plano original teniendo en cuentas las características intrínsecas y extrínsecas de la cámara.
Figura 2. Eje de coordenadas del IPM. Coordenadas del mundo (Xw, Yw, Zy) y coordenadas de la cámara (Xc, Yc, Yc)
Fuente: ALY, Mohamed. Real time detection of lane markers in urban streets. (IPM coordinates).
Por otro lado Nieto en su tesis doctoral plantea distintos casos para hallar el IPM teniendo todas, algunas o ninguna de las características intrínsecas y extrínsecas de la cámara. Cada caso aumenta su complejidad a medida que se omiten características, porque aumentan las incógnitas de la matriz de proyección. Todo esto, para poder tener una relación de distancias correctas en el plano rectificado, es decir, poder predecir distancias en la carretera, entre vehículos, carriles etc.
Para el caso en que se desconoce la matriz de calibración de la cámara, la translación y rotación relativa de la cámara, Nieto y Salgado plantean que se puede obtener el plano de homografía fácilmente a partir del punto de fuga ubicado en el eje Z (Vz), eliminando la distorsión de la perspectiva pero sin tener una escala real de las distancias en el plano (básicamente, el paralelismo), aunque teniendo una leve distorsión afín.
El método requiere del cálculo del punto de fuga principal de la carretera Vz. Luego se seleccionan cuatro puntos de la imagen como se representa en la Figura 3. La selección de estos puede ser hecha por la unión del punto de fuga con las esquinas inferiores de la imagen, seleccionando los puntos de intersección de estas líneas con dos líneas horizontales a diferentes alturas. La homografía luego es calculada a través de un algoritmo de transformación lineal directa (DLT).
Figura 3. Calculo de la homografía entre dos imágenes a partir de cuatro puntos. (a) Imagen original (en pixeles). (b) Imagen rectificada (en pixeles).
Fuente: NIETO DONCEL, Marcos. Detection and tracking of vanishing points in dynamic environments: Detección y seguimiento de puntos de fuga en entornos dinámicos. (Computation of the homography between images from the correspondence of four points, with a resulting affine distortion).
Los puntos de fuga son elementos muy importantes en el campo de la visión artificial, ya que son la fuente principal de información de un ambiente estructurado. Un punto de fuga es un punto en el plano de la imagen en la que la imagen de líneas paralelas del escenario parece converger . Aunque existen muchas estrategias para hallar los puntos de fuga de una imagen, todas estas tienen un fundamento común que es usar algoritmos que buscan la intersección de puntos de elementos con una orientación como líneas, segmentos de línea, bordes, etc.
La continua estimación de los puntos de fuga también permite estabilizar las imágenes rectificadas, debido a la inherente inestabilidad que presentan las imágenes IPM que puede causar que los cálculos de estimación del carril y su curvatura sean incorrectos, aun cuando se tenga todas las características intrínsecas y extrínsecas de la cámara. Jaureguizar usa el componente vertical
...