Sumario: | El movimiento es una característica fundamental para el procesamientode video y sus posteriores aplicaciones. La estimación de movimientoen video es de gran utilidad para definir la correspondencia depuntos en una escena, calcular sus velocidades y así poder discriminar objetos,acciones, segmentar movimiento, etc. El objetivo de este trabajo es realizar un seguimiento preciso y una estimación de movimiento de un gran conjunto de puntos. Esto se conoce comoestimación densa de movimiento. Para ello, se proponen dos líneas principales de estudio: modelos estadísticos de movimiento utilizando texturas dinámicas y el cálculo del flujoóptico minimizando la energía con graph cuts, en ambos casos considerandosecuencias de imágenes RGB y RGB-D. El modelo de texturas dinámicas está muy bien condicionado para lasegmentación de movimiento, y dentro de este contexto desarrollamos unaaplicación con características novedosas: (i) proceso de aprendizaje desacopladoy (ii) algoritmos optimizados para trabajar en placas gráficas GPU (Graphic Process Unit). Además, el modelo ha sido extendido para contemplarsecuencias de imágenes RGB-D, el cual no había sido estudiado hastael momento, permitiéndonos identificar procesos visuales en 3D. Experimentos sobre la base de datos DynTex muestran resultados exitososde performance y de clasificación para la mayoría de las casos. Luego,nuestros análisis sobre secuencias RGB-D revelan la viabilidad de este modelopara aplicaciones 3D. El problema de la estimación del flujo óptico (optical flow) fue abordadomediante la minimización de la energía del campo de vectores utilizando latécnica de graph cuts con una formulación novedosa de la energía. Ampliamosesta formulación para tener en cuenta la profundidad y así calcular el flujo de la escena (scene flow). Hasta donde sabemos, en la literatura, nuncase había utilizado graph cuts para estimar el scene flow. Los resultados obtenidossobre el dataset Middlebury muestran que nuestros algoritmos soncompetitivos comparados con los presentes en el estado del arte y los mejorescon en términos de error angular.
|