Recull de notícies

Cerca de notícies


  

Recull de notícies

30/06/2011
Un avenç significatiu en la segmentació del moviment en vídeos
Trajectòria.

Una tesi de Luca Zappella, que ha fet el doctorat en el grup de Visió per Computador i Robòtica (VICOROB), permet establir uns algoritmes que milloren substancialment la visió de la imatge per futures aplicacions com ara la robòtica, la vídeo vigilància o el seguiment del trànsit.

En aquesta tesi s’estudia, principalment, el problema de la segmentació del moviment (motion segmentation) en els vídeos. Segmentar consisteix en separar els diferents objectes que apareixen en una imatge. Així doncs, en dependència del tipus de segmentació, s’obtindran uns tipus d’objectes o uns altres. Per exemple, es pot segmentar per colors o per contorns, i si disposem d’una seqüència d’imatges o d’un vídeo també es pot segmentar des d’una nova dimensió: el moviment. D’aquesta manera es pot descompondre un vídeo en els diferents objectes que es mouen al llarg d’una seqüència determinada.

La segmentació d’objectes en moviment per a qualsevol tipus d’entorn és un problema difícil de resoldre. De fet, canvia completament per espais interiors o exteriors. Per aquest darrer, la il·luminació, les ombres i les condicions atmosfèriques solen ser extremes i, per tant, el tipus de processament ha de ser molt diferent al que es necessita en interiors, on les condicions estan més controlades. Aquesta descomposició és un primer pas fonamental per a l’elaboració de molts algoritmes (un conjunt finit d'instruccions o passos específics i organitzats que serveixen per a executar una tasca o resoldre un problema) que s'utilitzen en visió per computador.

Treball

L’investigador Luca Zappella, que ha dut a terme la seva tesi doctoral (Manifold clustering for motion segmentation) en el grup de recerca VICOROB (Visió per Computador i Robòtica) de la Universitat de Girona (UdG), presenta en el seu treball una revisió dels principals algoritmes de segmentació del moviment, l’anàlisi de les seves característiques principals i proposa una classificació de les tècniques més recents i importants. S’ha volgut donar una atenció especial als algoritmes de segmentació del moviment que utilitzen trajectòries (les línies de punts de seguiment que ressegueixen cada imatge de la seqüència de vídeo). L’objectiu és agrupar trajectòries que pertanyin al mateix moviment.

Per aconseguir-ho, els algoritmes proposats discriminen aquelles trajectòries que pertanyen a moviments diferents, ja que generen subespais diferents. Llavors, si s’estima el subespai generat per cada trajectòria i es mesura la similitud, el problema de la segmentació es pot entendre com un problema d’agrupament d’espais (manifold clustering).

Algoritmes

Aquest estudi aborda alguns dels reptes més difícils de la segmentació de trajectòries a través de l’agrupament d’espais. Concretament, s’han proposat nous algoritmes per a l’estimació del rang de la matriu de trajectòries, s’ha presentat una nova mesura de similitud entre subespais, s’han abordat problemes relacionats amb el comportament dels angles canònics i finalment s’ha desenvolupat una eina genèrica per estimar quants moviments apareixen en una seqüència. Els algoritmes finals combinen totes aquestes propostes prèvies amb èxit. Per tant, són uns dels pocs algoritmes, dins el camp de la segmentació del moviment, que no requereixen cap coneixement previ ni cap ajust manual.

La darrera part de l’estudi es dedica a la correcció de l’estimació inicial d’una segmentació del moviment. Aquesta correcció es duu a terme ajuntant els problemes de la segmentació del moviment i de l’estructura a partir del moviment. La solució proposada no només assigna les trajectòries als moviments correctes, sinó que també estima l’estructura 3D dels objectes i omple les entrades buides dins la matriu de trajectòries. Els algoritmes proposats han estat analitzats i comparats amb tècniques de l’estat de l’art utilitzant seqüències sintètiques i reals. Els resultats demostrem un comportament robust dels algoritmes proposats i una constant millora respecte l’estat de l’art. Aquests algoritmes es poden aplicar a la visió per computador, la robòtica, la vídeo vigilància, la vídeo indexació, el seguiment del trànsit, i moltes d’altres.

Investigador

Luca Zappella va llicenciar-se en Ciències de la Computació per la Universitat de Milà (2003), i durant tres anys va estar treballant, en un primer moment, en una empresa del sector i, poc després, pel seu compte, principalment en el camp de la visió per computador. En el 2008 va cursar el Màster Europeu en Visió i Robòtica (VIBOT) celebrat a Edimburg (Escòcia), Le Creusot (França) i Girona. Finalment, durant els darrers anys ha realitzat el doctorat en el camp de la segmentació del moviment i l’estructura 3D en el grup de recerca VICOROB sota la supervisió dels doctors Xavier Lladó i Joaquim Salvi.