Contrôle de TP - M1-GenPro (année 2012-2013)

Les documents de cours et TDs sont autorisés ainsi que les documents du web. Les différentes parties sont indépendantes. Il est conseillé de lire chaque partie (rapide survol) avant de la commencer.

Partie 1 : Analyse d'un contig de Bursaphelenchus xylophilus

Voici le numéro d'accession d'un contig du génome de Bursaphelenchus xylophilus que nous allons analyser : CADV01009238

(Q0) De quel Genre, Ordre et Embranchement fait parti Bursaphelenchus xylophilus ? Quel est son nom commun ?

(Q1) Quelle est la taille (bp) de ce contig ?

Nous souhaitons d'abord confronter ce contig aux protéines de la banque nr du NCBI.

(Q2) Quelle variante de BLAST choisissez-vous ?

Voici les résultats obtenus avec les paramètres par défaut : [résultat]

(Q3) Quel "type" de résultat constatez-vous (analyser uniquement le dessin de distribution des hits) ? Comment expliquer cela ?

(Q4) Les Evalues des alignements associés obtenus contre la 1ere séquence trouvée de la banque ADY41274 sont-ils tous probants ? Ceux avec ACO48361 (1er alignement avec "boîtes bleux" entre la position 4500 et 9000 sur la query) le sont-ils tous également ? Expliquez.

(Q5) Même question que (Q4) mais désormais sur la qualité des alignements et leur bornes. Justifier ce résultat .

(Q6)

(a) Donnez le sens du gène sur ce contig. Est-ce cohérent ou surprenant ? Expliquez.
(b) Estimez et donnez de manière assez empirique (~dizaine de bases près) les positions de début ou fin des exons sur le contig en utilisant la séquence ADY41274 et corrigeant certains artefacts. Combien d'exons (au minimum) attendez vous sur ce gène ? Pourquoi ne sont-ils pas sur la même phase ?
(c) A-t-on à priori trouvé la totalité des exons et du CDS ?


Nous souhaitons localiser les positions du CDS de manière plus précise à l'aide de GeneWise2 sur la protéine ADY41274.

(Q7) Décrire rapidement les étapes à réaliser sur l'interface Wise2 de Mobyle pour obtenir ce resultat.

Voici les résultats obtenus avec Wise2 : [résultat]

(Q8) Y a t'il des codons chevauchants deux exons selon Wise2 ? Lesquels ? Comment sont-il représentés sur le diagramme de Wise2 ?

(Q9) Les résultats de Wise2 sont-ils cohérents avec les précédents calculs de BLAST ? Y a t-il eu de nouveaux exons trouvés ? des alignements de BLAST exclus ? des exons raffinés ? Soyez précis sur cette analyse.

(Q10) Que peut-on dire du CDS obtenu avec WISE ? Est-il trouvé "complet" ? Quelle raison pourrait justifier l'absence éventuelle du début/fin du CDS par rapport au Contig ? Vous pouvez utiliser les résultats de Wise2 ainsi que ceux de Blast pour vous aider dans cette analyse.

Partie 2 : Etude d’une protéine d’Arabidopsis thaliana

Voici sa séquence :

> Protéine mystère [Arabidopsis thaliana]
MSLQYHVLNSIPSTTFLSSTKTTISSSFLTISGSPLNVARDKSRSGSIHCSKLRTQEYIN
SQEVQHDLPLIHEWQQLQGEDAPQISVGSNSNAFKEAVKSVKTILRNLTDGEITISAYDT
AWVALIDAGDKTPAFPSAVKWIAENQLSDGSWGDAYLFSYHDRLINTLACVVALRSWNLF
PHQCNKGITFFRENIGKLEDENDEHMPIGFEVAFPSLLEIARGINIDVPYDSPVLKDIYA
KKELKLTRIPKEIMHKIPTTLLHSLEGMRDLDWEKLLKLQSQDGSFLFSPSSTAFAFMQT
RDSNCLEYLRNAVKRFNGGVPNVFPVDLFEHIWIVDRLQRLGISRYFEEEIKECLDYVHR
YWTDNGICWARCSHVQDIDDTAMAFRLLRQHGYQVSADVFKNFEKEGEFFCFVGQSNQAV
TGMFNLYRASQLAFPREEILKNAKEFSYNYLLEKREREELIDKWIIMKDLPGEIGFALEI
PWYASLPRVETRFYIDQYGGENDVWIGKTLYRMPYVNNNGYLELAKQDYNNCQAQHQLEW
DIFQKWYEENRLSEWGVRRSELLECYYLAAATIFESERSHERMVWAKSSVLVKAISSSFG
ESSDSRRSFSDQFHEYIANARRSDHHFNDRNMRLDRPGSVQASRLAGVLIGTLNQMSFDL
FMSHGRDVNNLLYLSWGDWMEKWKLYGDEGEGELMVKMIILMKNNDLTNFFTHTHFVRLA
EIINRICLPRQYLKARRNDEKEKTIKSMEKEMGKMVELALSESDTFRDVSITFLDVAKAF
YYFALCGDHLQTHISKVLFQKV

(Q1) Comment pouvez-vous identifier sa fonction ? (Donnez juste la méthode)

(Q2) Analysez et interprétez les résultats de TopPred et de TMHMM.

(Q3) Analysez et interprétez les résultats de SignalP (aide). La protéine possède t-elle un peptide signal d’export extracellulaire ? Si oui, donnez la position du site de clivage.

(Q4) Analysez et interprétez les résultats de ChloroP (aide). La protéine possède t-elle un peptide transit pour son export dans le chloroplaste ? Si oui, donnez la position du site de clivage.

(Q5) Concluez en vous aidant du résultat de TargetP (aide).

Nous allons maintenant étudier l’alignement de notre protéine avec 4 autres protéines de la même famille. Ces protéines ont la même structure et présentent les mêmes propriétés que notre protéine mystère

(Q6) A l’aide de quel(s) programme(s) (type(s) et nom(s)) pouvons-nous réaliser cet alignement ?

Voici le résultat de l’alignement des 5 séquences

(Q7) Quel est le plus long motif conservé entre ces séquences ?

(Q8) Par rapport à l’ensemble de la séquence, le début vous semble t-il conservé? Qu’en concluez-vous par rapport aux questions (Q3) - (Q4) ?

Fin des hostilités, année 2012-2013