La source sémantique : les mots qui définissent tous les autres mots

 

Stevan Harnad

Université du Québec à Montréal

 

Domaine : structures abstraites

Programme projet de recherche en équipe

Concours 2013-2014

Combien de mots doit-on comprendre - et lesquels - pour être en mesure de définir tous les autres à partir de cet ensemble de source ? Ce problème fondamental de « l'ancrage des symboles » s'exprime naturellement dans le cadre de la théorie des graphes: En liant tout mot à chacun des mots de sa définition, on obtient le graphe d'un dictionnaire. Il s'agit alors de "casser" les cycles de définitions, un célèbre problème combinatoire NP-difficile.

Cette formulation du problème, en traitant les circuits des graphes, ouvre la porte à un riche spectre d'études et d'applications novatrices en apprentissage des langues premières et secondes, construction des dictionnaires, traduction automatisée, outils Web, et lexique mental : L'analyse des dictionnaires (traitement automatique des langues, informatique cognitive), la manipulation des graphes (mathématiques, recherche opérationnelle) et l'analyse des résultats (linguistique, psycholinguistique) présentent des problèmes complexes en interrelation nécessitant pour leur résolution la réunion d'expertises variées.

Nous proposons d'attaquer le problème en nous basant sur la combinatoire, la programmation linéaire ainsi que les méta-heuristiques. Notre équipe, composée d'étudiants et de chercheurs chevronnés, a obtenu des résultats préliminaires prometteurs pour quatre dictionnaires en anglais et nous planifions compléter et étendre nos analyses au français et à d'autres langues et à d'autres types de dictionnaires (bilingues, médicaux, glossaires techniques) afin d'évaluer, d'étendre et d'appliquer nos résultats.