Stage recherche Master 2, 2013

Contexte

La leucémie aigue lymphoblastique (ALL, Acute Lymphoblastic Leukemia) est un cancer liquide touchant principalement les enfants. Le taux de survie des patients affectés par une ALL a nettement augmenté dans les dernières décades, grâce à des diagnostics plus précis et aussi une meilleure stratégie thérapeutique. Le diagnostic de ALL demande d'analyser les lymphoblastes et les lymphocytes, en dénombrant ces cellules selon leur réarrangement VDJ, réarrangement donnant des milliards de possibilités différentes à partir d'un répertoire de quelques gènes. Les patients sont suivis tout au long de leur traitement, des prélèvements sanguins sont effectués à intervalles réguliers afin d'identifier toute rechute. La méthode utilisée pour le suivi consiste à évaluer la concentration des lymphoblastes possédant le même réarrangement VDJ que lors du diagnostic.

Des études se sont intéressées à la diversité de ces réarrangements, telles que (Boyd, 2009), mais n'ont pas été vers une évaluation quantitative des « profils VDJ ». Une autre étude plus récente (Warren, 2011) a permis d'établir une première borne minimale du nombre de lymphoblastes différents. Cependant, en raison des techniques utilisées, cette étude ne permet pas réellement d'avoir une idée de la distribution des différents réarrangements au sein d'un échantillon et, a fortiori, de leur évolution chez un patient malade. De plus cette borne minimale est très loin des bornes théoriques (1 million contre plusieurs milliards).

Problématique

Ce projet s'inscrit dans une collaboration entre l'équipe Bonsai du LIFL, la plateforme de séquençage de Lille 2 et de l'IRCL, et le laboratoire d'hématologie du CHRU de Lille. Notre nouvelle approche s'appuie sur les progrès colossaux réalisés dans le domaine du séquençage de l'ADN via les séquenceurs à haut débit, capable de séquencer des millions de séquences en quelques heures. Trois "runs" de test ont déjà été effectués en 2011 et 2012 pour séquencer les lymphocytes de patients suivis au CHRU.

Un prototype permettant l'analyse de la concentration des lymphoblastes en fonction de leur réarrangement VDJ a été développé au sein de l'équipe Bonsai. Le développement de ce prototype continuera en 2013 (notamment par un autre stage M2 suivi d'un CDD ingénieur 5 mois). Les premiers résultats sont satisfaisants et permettent de retrouver, sur des donnés patient, des résultats précédemment validés par les cliniciens. Cette méthodologie permet de mieux comprendre la maladie résiduelle : comment émergent de nouveaux clones, comment évoluent-ils ?

Travail à réaliser

Les études existantes, telles que (Boyd, 2009, Sci Transl Med) tout comme notre prototype, se basent toutes sur un « répertoire VDJ » humain connu. Si cela permet une assignation rapide, cetten méthode ne permet pas d'analyser les réarrangements VDJ lorsque le répertoire du patient diffère beaucoup du répertoire de référence. Le stage vise donc à proposer des algorithmes permettant une analyse à large échelle des réarrangements VDJ sans a priori, c'est à dire sans partir d'un répertoire VDJ de référence. Le but est double : améliorer les connaissances fondamentales sur la diversité de ces répertoires et ce des profils VDJ, et disposer de meilleurs outils pour le diagnostic et le suivi des leucémies.

Concrètement, le stage débutera par une étude bibliographique sur des techniques avancées d'algorithmique du texte (pattern matching, graines, indexation, filtrage) mais aussi sur le domaine biologique. Puis le stagiaire étudiera des algorithmes pour obtenir, à partir d'un ensemble de reads provenant de quelques individus, leurs « profils VDJ », c'est-à-dire le répertoire des gènes VDJ qui ont été séquencés ainsi qu'une mesure de la présence des différents réarrangements VDJ au sein d'un échantillon. Nous souhaitons explorer des pistes prometteuses utilisant le dénombrement et classification de k-mers découpés sur les reads.

Les idées propososées durant le stage seront implémentées et expérimentées, sur des ensembles de reads simulés puis réels, issus de patients suivis au CHR de Lille.

Poursuite en thèse

Être capable d'analyser systématiquement les profils VDJs permet d'envisager des études qui dépassent largement le cadre des leucémies : comment une réaction immunologique se traduit, quantitativement, sur le profil VDJ d'un individu ? Au sein d'une population, quelles sont les variations entre les profils VDJ de plusieurs individus ?

Répondre à ces questions demande d'avoir de puissants outils algorithmiques. Ce stage de M2 pourrait donc se poursuivre par une thèse sur la conception de structures de données adaptées au stockage et la comparaison de profils VDJ sur une population de plusieurs individus. Les structures d'indexation habituellement utilisées (arbres et tables de suffixes) ne sont en effet pas adaptées au stockage de telles informations.

Compétences requises

Bibliographie (envoyée sur demande)