Apprentissage non supervisé d'architectures profondes pour le changement d'expressions faciales

 

Roland Memisevic

Université de Montréal

 

Domaine : technologies de l'information et des communications

Programme projet de recherche en équipe

Concours 2015-2016

L'apprentissage machine a connu une croissance importante au cours des dernières années, en particulier appliqué à la modélisation d'images, mais de nombreuses questions intéressantes demeurent en suspens. La recherche proposée se concentre sur l'apprentissage non-supervisé de représentations associées à des séquences d'entrées telles que le vidéo.

L'objectif est de mettre au point de nouveaux algorithmes d'apprentissage de représentations profondes (à plusieurs niveaux) permettant à la machine de découvrir et démêler les facteurs explicatifs cachés derrière les données. Le projet proposé s'intéresse en particulier à découvrir les facteurs expliquant le changement d'une trame vidéo à l'autre, comme par exemple ceux dûs aux mouvements des objets dans la scène, par opposition aux facteurs généralement constants (comme l'identité des objets).

La recherche se concentrera sur une application précise qui est intéressante industriellement, c'est-à-dire la modélisation des expressions et des émotions sur les visages. Du côté théorique, une des questions posées concerne la manière dont l'algorithme prédit les facteurs sous-jacents (le mécanisme d'inférence), et le compromis entre efficacité de calcul et précision qui pourrait y être amélioré.