Raisonnement sur les concepts et les instances au moyen de la sémantique des espaces vectoriels

 

Jackie Chi Kit Cheung

Université McGill

 

Domaine : technologies de l'information et des communications

Programme : Établissement de nouveaux chercheurs universitaires

Concours 2016-2017

Les systèmes informatiques élaborés par la recherche en traitement de la langue naturelle, comme les assistants virtuels et les systèmes de dialogue, nous permettent de manipuler et d'interagir aisément avec les objets nous entourant ainsi qu'avec les événements de notre quotidien. Des méthodes statistiques ont été récemment élaborées pour apprendre, à partir de vaste corpus de documents, le sens de chaque terme selon leurs utilisations. Conceptuellement, chaque terme est représenté par un vecteur de valeurs continues.

Une des limites des méthodes actuelles consiste dans le fait qu'elles traitent tous les mots de la même manière et ne font pas de distinction entre les concepts généraux, tels que « ville » ou « pays », et les instances de concepts, comme « Montréal » et « Québec ». Apprendre à différencier les concepts et les instances est nécessaire à l'élaboration d'une théorie computationnelle pratique de la sémantique.

Je propose que l'on élabore des méthodes computationnelles de raisonnement au niveau des concepts et des entités de manière à tenir compte de leur nature distincte. Pour cela, il faut déterminer, pour un problème de traitement de la langue naturelle donné, quels aspects du problème impliquent un raisonnement au niveau des concepts ou des instances. Nous permettrons ainsi aux outils informatiques complexes en traitement de la langue naturelle de bénéficier des avantages d'une sémantique des espaces vectoriels appris à partir de vastes quantités de données. Par conséquent, les résultats de ce projet seront utiles dans des domaines tels que les systèmes de dialogue, les systèmes de questions et réponses ainsi que les applications relatives aux assistants virtuels.