Mise à l'échelle automatique, basée sur la modélisation, des flux de mégadonnées dans les environnements infonuagiques

 

Yan Liu

Université Concordia

 

Domaine : technologies de l'information et des communications

Programme établissement de nouveaux chercheurs universitaires

Concours 2015-2016

Les systèmes de traitement de flux de données  (« Data Stream Processing Systems »  or DSPS) sont conçus pour traiter de gigantesques flux de données à haute vitesse. Dans le domaine de l'infonuagique (« Cloud Computing ») les techniques de mise à l'échelle automatique permettent aux DSPS de faire face à des pics de charge inattendus, d'une part, et de réduire les coûts associés à un sur-approvisionnement constant des ressources, d'autre part. Deux grands défis se posent ici. En premier lieu, il importe d'équilibrer les charges de travail qu'imposent aux ressources informatiques (comme les serveurs ou les nœuds) les tâches liées au traitement incrémentiel des flux de données. En second lieu, il faut déterminer le moment le plus opportun pour l'ajout ou la réduction des serveurs ou des nœuds.

Nous proposons d'explorer une nouvelle méthode de mise à l'échelle automatique, basée sur les modèles. Elle aura deux objectifs : d'abord, la formulation d'un algorithme de mise à l'échelle automatique afin de quantifier les facteurs qui influent le plus sur les activités de mise à l'échelle; ensuite, l'implantation d'un mécanisme permettant, dès l'exécution, la migration de tâches relatives au traitement de flux de données au sein de grappes, serveurs et nœuds informatiques. La réalisation de cette méthode est essentielle à la conception d'un processus autogéré, élastique et rentable pour le traitement des gigantesques flux de données dans le nuage (cloud). Le  succès de la présente initiative se traduira par la possibilité d'intégrer les algorithmes proposés et les logiciels en découlant aux plateformes qu'offrent actuellement les fournisseurs de solutions infonuagiques (cloud).