Prédiction automatique de modifications du code génétique et de l'ARN messager

 

Nadia Sophie El-Mabrouk

Université de Montréal

 

Domaine : technologies de l'information et des communications

Programme : projet de recherche en équipe

Concours 2017-2018

Les protéines sont des polypeptides (chaîne d'acides aminés) indispensables au fonctionnement d'une cellule. La chaîne d'acides aminés constituant une protéine est déterminée par un gène d'ADN, où chaque triplet (suite de trois nucléotides A, C, G, T) code pour un acide aminé donné. Cependant, il arrive qu'une séquence d'ADN ne produise pas la suite d'acides aminés attendue. Ceci peut-être dû à une modification du code génétique, dans le sens où un triplet code pour un acide aminé différent de celui indiqué par le code génétique standard. Une telle réassignation de codon est généralement accompagnée d'une modification de l'ARN de transfert (ARNt) qui transporte l'acide aminé en question. D'autre part, des corrections post-transcriptionnelles affectant la séquence d'ARN messager (ARNm) peuvent aussi expliquer la différence entre un gène et la protéine produite.

Ce projet de bioinformatique a pour objectif de permettre une prédiction automatique de tels mécanismes, avec des retombées immédiates pour l'annotation fonctionnelle des gènes. L'objectif est également d'étudier l'évolution de ces mécanismes en se basant sur une analyse phylogénétique d'un ensemble d'espèces proches. C'est un projet multidisciplinaire nécessitant une expertise complémentaire en biochimie, biologie computationnelle et mathématiques. Les méthodes développées se baseront sur des approches algorithmiques, statistiques et d'apprentissage machine. Nos outils seront appliqués aux génomes mitochondriaux, de plasmides, et de symbiotes bactériens et pathogènes, susceptibles d'être particulièrement sensibles à de telles modifications biologiques en raison de leur taux d'évolution accéléré.