Exploitation de diverses ressources sémantiques pour une traduction automatique à granularité hétérogène

 

Jackie Chi Kit Cheung

Université McGill

 

Domaine : structures abstraites

Programme : projet de recherche en équipe

Concours 2017-2018

La traduction automatique a connu un essor considérable ces dernières années, grâce aux avancements dans l'architecture des réseaux de neurones et celle utilisant l'apprentissage profond. Cependant, plusieurs défis restent encore entiers dont la performance de la traduction automatique en comparaison à la traduction humaine, spécialement quand le contexte de la phrase est nécessaire lors de la production des traductions pertinentes et correctes.

Dans ce projet, nous visons l'exploitation et exploration de plusieurs ressources sémantiques, exemple l'analyse distributionnelle ainsi que d'autres connaissances extraites des ontologies, afin de bien les intégrer dans l'architecture de la traduction automatique neuronale.

Nous visons les problèmes clés et majeurs de la traduction automatiques à différents niveaux de granularité. Au niveau des mots, nous allons considérer les corrélations entre les types des mots de la langue cible comme étant un problème de prédiction structurée pour un large vocabulaire. Au niveau des phrases, nous visons l'amélioration des expressions polylexicales et idiomes. Au niveau du discours, nous visons la modélisation des transitions des entités à travers un passage pour une meilleure clarté référentielle.

Ce projet de recherche aboutira à plus d'avancées dans le domaine de la traduction automatique. En effet, en développant des techniques et algorithmes fondamentaux pour une traduction automatique efficace et performante, ce projet de recherche aboutira à des solutions aux problèmes majeurs de la génération automatique de textes et la compréhension du langage naturelle.