Inférence bayésienne appliquée à des modèles de développements de cancers du sang


Sujet de stage:

Certains cancers du sang surviennent suite à l’acquisition d’une mutation (dite motrice) au niveau d’une cellule souche hématopoïétique (CSH), puis à l’expansion clonale qui en résulte. C’est notamment le cas pour les Néoplasmes Myéloprolifératifs (NMP) qui sont des pathologies malignes du sang conduisant à la surproduction d’un certain type de cellules (plaquettes, globules blancs ou rouges),en d’autres termes à une altération de l’hématopoïèse. Souvent, ces maladies ne sont détectées que suite à la survenue de complications (thromboses, accidents cardio-vasculaires) pouvant accroître le risque de décès chez les patients atteints de ces maladies. Or, des études récentes ont montré que les mutations responsables des NMP pouvaient apparaître plusieurs années ou décennies avant la survenue des symptômes. Un tel constat ouvre la voie à des méthodes de dépistage précoce pour ces cancers du sang en particulier.

 

Mettre en place des stratégies de dépistage précoce des NMP nécessite de comprendre la cinétique d’apparition de la mutation puis du développement du clone muté. Or, cette maladie n’étant pas suffisamment prévalente dans la population, on ne peut pas avoir recourt à des études statistiques sur des cohortes de grandes tailles. L’approche choisie repose alors sur des modélisations mathématiques.Plusieurs travaux ont déjà été menés dans ce sens :- Van Egeren et al. (Reconstructing the Lineage Histories and Differentiation Trajectoires of Individual Cancer Cells in MPN, Cell Stem Cell, 2021), à partir du séquençage de cellules souches, ont reconstruit des arbres phylogénétiques qu’ils ont ensuite utilisés pour calibrer un modèle (modèle de Wright-Fisher) à l’aide d’une méthode ABC (Approximate Bayesian Computation). - En collaboration avec l’Institut Gustave Roussy, nous avons adopté une approche similaire.Néanmoins, notre approche diffère par le type de données expérimentales en notre possession et lechoix du modèle (travail en cours de publication).

 

L’objectif principal de ce travail sera de valider les résultats qui ont été obtenus en croisant les deux études.

1) Fitter / calibrer notre modèle à partir des données de Van Egeren et al.

2) Fitter le modèle de Wright-Fisher avec nos données. La calibration des modèles (c’est-à-dire l’estimation des paramètres) reposera sur une méthode d’inférence Bayésienne, à savoir ABC-SMC (ABC - Sequential Monte Carlo) dont un package Julia a été développé par un membre de l’équipe. Le travail sera a effectuer en langage Julia (syntaxe proche de Python).

 

Dans un second temps, le travail pourra porter également sur l’amélioration des modèles actuels (prise en compte de recombinaisons homologues, introduction de mécanismes de régulation, etc.)Enfin, il pourra être intéressant d’étudier comment l’intégration de données hétérogènes et de différents modèles au sein d’un framework mathématique rigoureux peut aider à la mise en place de méthodes de détection précoce de ces maladies qui soient les plus robustes possible. Pour cette dernière partie, on pourra également étudier la généralisation à d’autres modèles issus de la littérature scientifique ainsi qu’à des données de différentes natures accessibles publiquement.

Profil recherché:

Elève ingénieur ou Master avec une spécialisation en mathématiques appliquées, statistique ou datascience et un fort intérêt pour les applications biomédicales.

Modalités:

Stage d’environ 6 mois, sur l’année 2021-2022, au laboratoire MICS (Mathématiques et Informatique pour la Complexité et les Systèmes) de CentraleSupélec sous la supervision de Gurvan Hermange.

Pour plus de renseignements, contacter gurvan.hermange@centralesupelec.fr