El procesamiento de la imagen incluye diferentes etapas
Alumnos de Ingeniería en Informática de la Facultad de Ingeniería y Ciencias Hídricas (FICH) lograron que una computadora reconozca las señas hechas por una mano frente a una cámara web con una eficiencia superior al 87%.
El sistema utiliza elementos de bajo costo: una webcam de resolución media (como las que existen en cualquier hogar) y una computadora, y podría llegar a usarse como control remoto o en otros tipos de interfaces y "conexiones" entre hombre y ordenador. “Habíamos visto que existían otros trabajos sobre el tema, pero que tenían muchas restricciones, como la necesidad de que la mano tenga un guante para ser identificada, por ejemplo.
Nosotros buscábamos una aplicación adaptada a situaciones cotidianas, darle instrucciones a la computadora en un ambiente natural, con luz común, evitando las condiciones de laboratorio o cámaras de alta resolución”, afirmó Juan Pablo Hernández Vogt, uno de los autores, con el que trabajaron Pablo Novara y Javier Godoy.En sí, se trata de un desarrollo sencillo, pero su importancia radica en las utilidades que se le podría dar. Con algunas modificaciones se podría llegar a realizar un software que reconozca el lenguaje de señas para sordos o controlar toda una presentación audiovisual a distancia, prescindiendo del teclado y el mouse.
Nosotros buscábamos una aplicación adaptada a situaciones cotidianas, darle instrucciones a la computadora en un ambiente natural, con luz común, evitando las condiciones de laboratorio o cámaras de alta resolución”, afirmó Juan Pablo Hernández Vogt, uno de los autores, con el que trabajaron Pablo Novara y Javier Godoy.En sí, se trata de un desarrollo sencillo, pero su importancia radica en las utilidades que se le podría dar. Con algunas modificaciones se podría llegar a realizar un software que reconozca el lenguaje de señas para sordos o controlar toda una presentación audiovisual a distancia, prescindiendo del teclado y el mouse.
Funcionamiento
El proceso consta de varias etapas: comienza con la captura de la imagen, luego se trata de “recortar” la mano del fondo y otros elementos, como el brazo. Una vez extraída la silueta, el modelo la compara con un conjunto de patrones que se corresponden con cada seña a reconocer. Esto implica que el usuario debería entrenar en el sistema para que aprenda las características de cada una de ellas.
Los gestos reconocidos pueden ser empleados como entrada en el control de equipamiento o ser traducidos a otra forma de información. Esto es posible porque el proceso ocurre en tiempo real. El principal problema que los estudiantes debieron sortear fue las características deficientes de las imágenes, producto de la poca resolución de la cámara. Para ello diferenciaron el “ruido” proveniente de los problemas técnicos y se ocuparon de la silueta de la mano en sí.“Comenzamos logrando que la computadora interpretara tres señas, para luego reconocer catorce. Esa cantidad nos pareció suficiente, aunque podríamos haber inventado muchas más”, destacó Godoy.Para los ensayos se conformó una base de 126 imágenes (realizaciones de 14 señas) con una cámara web estándar, bajo condiciones de iluminación natural. “Al capturar las imágenes buscamos que la persona realizara las señas con la mayor naturalidad posible”, explicaron los alumnos.
El método propuesto logra, además, una aproximación a la aplicación del sistema en tiempo real suficientemente aceptable como para ser considerada un buen punto de partida para trabajos futuros.
Dirección de Comunicación
Universidad Nacional del Litoral - Argentina
Facultad de Ingeniería y Ciencias Hídricas
No hay comentarios:
Publicar un comentario