À propos de l'utilisation de copules et de la vraisemblance composite pour des données avec variables manquantes

 

Jean-François Plante

HEC Montréal

 

Domaine : strurtures abstraites

Programme établissement de nouveaux chercheurs universitaires

Concours 2010-2011

Malgré la multitude de méthodes statistiques connues, certaines données peuvent difficilement être analysées avec des outils courants. Ce projet porte sur l'ajustement d'un modèle de probabilité multivarié à partir de données incomplètes. Plus précisément, nous étudierons le cas où les données proviennent d'études (ou de bases de données) qui n'ont pas mesuré toutes les variables d'intérêt. Par exemple, on ajustera un modèle pour (W,X ,Y ,Z) à l'aide de trois études ayant mesuré (X,Y ,Z), (W,X) et (W,Y ,Z) respectivement. Dans cet exemple, aucune donnée complète n'est disponible, ce qui représente un défi majeur.

Trois stratégies différentes seront adoptées pour aborder le problème. Elles seront étudiées et comparées afin de déterminer des balises qui indiqueront la marche à suivre pour analyser de véritables données. Les champs d'application sont illimités puisque cette contribution fondamentale pourra être utilisée par n'importe quelle science quantitative. La loi ajustée peut servir de base à l'inférence statistique, permettre de faire des prévisions, ou encore être utilisée comme modèle dans une étude de Monte Carlo.