26 enero 2008

Atención Visual - movimiento (1.2.1)



[Ver el vídeo a resolución original]

En este otro vídeo, se puede observar el termino de atención visual y saliencia asociado al movimiento. Ahora nuestro esquema, muestra un alto interés por todo lo que se mueve en la imagen.

[*] En esta atención por el movimiento no está definido ningún tipo de difusión de saliencia (los pixeles con saliencia no influyen en la saliencia de los pixeles vecinos).
[*] Computamos la saliencia en una frecuencia de 150ms. Por tanto cada segundo somos capaces de calcular unas 5-6 veces la saliencia y decidir el movimiento del "ojo". (En un futuro la acción de calcular saliencia y decisión de movimiento tiene que desacoplarse e ir cada una a un ritmo independiente).
[*] El movimiento lo calculamos en base a la diferencia del valor del pixel entre 2 frames consecutivos. En esta y en muchas otros videos, puede existir ruido debido a la calidad del video, por ello para que "exista movimiento" el pixel debe variar como mínimo 15 unidades en terminos absolutos.

22 enero 2008

Capacidad de atención

Por medio de Ánibal (un ex-compañero de trabajo y amigo), me ha hecho llegar un link bastante interesante sobre la atención humana. Si quieres hacer la prueba y comprobar tu capacidad de atención te recomiendo que lo hagas.

http://www.oviedo.es/personales/comecoco/ilusiones%20opticas/prueba%20de%20atencion.htm

Una vez realizado el ejercicio, es interesante comprobar como somos capaces de concentrarnos en un aspecto en concreto y obviar la información restante. Para relacionarlo con el proyecto que tenemos entre manos, sería equiparable a implementar una saliencia parametrizada mediante el color blanco, de este modo solo atenderíamos a las personas de color blanco.

Intentaré, cuando tenga un rato, utilizar este video de demostración para nuestro sistema, a ver que tal se comporta utilizando la característica de color como saliencia principal.

17 enero 2008

Atención Visual ( v1.2.0 )



[Ver el vídeo a resolución original]

Esta es la primera demo funcional que tengo del proyecto. Como se observa, el sistema le llama la atención las cosas de color, en nuestro caso el color rojo. Podemos definir la saliencia como la característica que hace que nos llame más la atención cierto estímulo.

Aspectos añadidos al algoritmo:
* Únicamente tiene interés las cosas de color (en nuestro caso el rojo), y jugamos con 4 objetos: 3 del mismo tamaño y un cuarto más pequeño. A partir de ahora lo denominaremos "saliencia"
* Si un pixel tiene saliencia, afecta positivamente a la saliencia de los pixeles vecinos. De ahí que veamos que las figuras que genera el sistema (derecha) no son iguales que las figuras rojas de la izquierda. De ahora en adelante lo llamaremos "Difusión de Saliencia". Esta característica produce un rapido crecimiento en la saliencia de los objetos interesantes.
* Cuando visitamos un punto con nuestro "ojo", ese punto y todos los que conforman nuestro ojo pasan a tener saliencia 0. A partir de ahora llamaremos a este proceso "Inhibición de Retorno"

Teniendo una primera versión funcional, podemos ir ajustando y cambiando el algoritmo para dotar al sistema de un mayor número de características que produzcan atención (colores, bordes, movimiento, caras) y may

08 enero 2008

WebService en JDE

Desde hace unos años, los webservice se vienen utilizando bastante y en concreto en entornos .NET, ya que se basan en ellos para realizar la comunicación entre aplicaciones ( Microsoft Robotics Studio).
En la arquitectura de JDE, hace poco añadimos un nuevo driver capaz de ofrecer un servicio web. Dicho servicio web está implementado en c++ ayudándonos de GSOAP. Este paso es muy importante, ya que permite a la arquitectura JDE poder comunicarse con el mundo exterior mediante un protocolo estándar como es SOAP (XML+HTTP).
Más abajo veréis una pequeña demo, donde somos capaces de gobernar y obtener información de la pantilt, mediante un cliente SOAP programado en .NET corriendo sobre una PDA. La idea es que en un tercer ordenador que tiene comunicación fisica con la pantilt y gobernado por JDE, seamos capaces (gracias a una PDA y conexión wi-fi) de poder controlar el cuello mecánico.



[Ver vídeo a resolución original]