Portage et évaluation de chaînes de traitements neuroinformatiques reproductibles sur des infrastructures pour les masses de données

 

Tristan Glatard

Université Concordia

 

Domaine : technologie de l'information et des communications

Programme : établissement de nouveaux chercheurs universitaires

Concours 2018-2019

Les chaînes de traitements de données sont des composants clés de la méthode scientifique et contribuent à la fiabilité des résultats en favorisant l'automatisation et la reproductibilité plutôt que les manipulations manuelles des données. Le but de ce projet est de proposer un cadre pour le déploiement et l'évaluation automatiques des chaînes de traitement neuroinformatiques sur des infrastructures adaptées aux données massives. Ces infrastructures accélèrent considérablement les applications dominées par les accès aux données par comparaison aux technologies traditionnelles de calcul intensif. Cependant, elles demeurent peu utilisées en neuroinformatique, ce qui conduit à un gaspillage de ressources matérielles et à des opportunités manquées pour les analyses à grande échelle. Ce projet fournira des outils pour porter automatiquement les chaînes de traitement existantes sur ces infrastructures. Ces nouveaux déploiements doivent être examinés avec soin car les caractéristiques des infrastructures peuvent introduire d'importants problèmes de reproductibilité provenant d'instabilités numériques. Pour résoudre ce problème, nous allons chercher à concevoir une méthode permettant d'identifier les composants des chaînes de traitement qui introduisent ou amplifient le bruit numérique. Nos méthodes seront appliquées aux principaux moteurs d'exécution de chaînes de traitements utilisés en neuroinformatique. Nous nous concentrerons sur des cas d'utilisation liés aux études d'imagerie de populations et à l'imagerie à très haute résolution.