Détail du sujet

26/10/2012 Sujet 2 :  Reconstituer le puzzle : depuis des fragments jusqu'à l'ARN
Auteur : Mikaël Salson  Ecrire Site
(Responsable Informatique : Mikaël Salson  Ecrire )
Sujet recherche

Chez les organismes dits supérieurs, l'ADN est constitué d'exons et d'introns qui sont porteurs de l'information génétique.  Mais cette information est la même dans toutes les cellules de l'organisme, alors que les cellules peuvent jouer des rôles différents (pensons à une cellule de la rétine ou du cœur…).
La fonction des cellules dépend essentiellement des ARN qui s'y trouvent.  Un ARN est constitué d'une combinaison spécifique d'exons consécutifs le long du génome.  L'étude des ARN est non seulement indispensable pour comprendre le fonctionnement cellulaire, mais elle constitue aussi un enjeu important dans l'étude de pathologies telles que les cancers. Des technologies très recentes permettent de séquencer l'ensemble des ARN d'une cellule en utilisant une technique appelée RNA-Sequencing.  Ces séquenceurs génèrent des millions, voire des milliards, de courts fragments provenant de ces ARN : les lectures.  Autrement dit, dans une expérience de RNA-Seq, nous allons générer une énorme quantité de lectures provenant de plusieurs milliers d'ARN différents. Cependant, comment savoir quelles sont les lectures qui appartiennent aux bons ARN ?  Une stratégie possible est de localiser chacune de ces lectures sur un génome de référence afin de retrouver la position d'origine de chacune d'elle puis, et donc, par extrapolation de retrouver la position d'origine de chaque ARN.

Le but de ce projet est d'aller au-delà de la seule position d'origine d'un ARN. Il s'agit, à partir du positionnement des lectures, de reconstituer un ARN complet tel qu'il était présent au sein de la cellule.
             
Une fois les lectures localisées sur le génome, la difficulté est d'associer les lectures les unes avec les autres, pour être capable de reconstituer l'ARN originel. Dans ce cadre, il existe des logiciels, tels que Cufflinks, qui permettent de reconstituer des ARN à partir de lectures positionnées sur le génome.  Dans le cadre de ce projet, il faudra proposer et implanter une méthode permettant de reconstituer, en partie, les ARN.
Un bon point de départ est l'utilisation des Gk-arrays.

Compétences demandées : Bonne maîtrise du C ou du C++, intérêt pour la biologie.

Liens associés :
Sujet attribué
Affecté à : Charles Husquin [M1-INFO]  Ecrire 
Soutenance : prévue le 31/05/2013 à 08h30     Salle : M5-A7