Voici le numéro d'accession d'un contig du génome de Bursaphelenchus xylophilus que nous allons analyser : CADV01009238
(Q0) De quel Genre, Ordre et Embranchement fait parti Bursaphelenchus xylophilus ? Quel est son nom commun ?
(Q1) Quelle est la taille (bp) de ce contig ?
Nous souhaitons d'abord confronter ce contig aux protéines de la banque nr du NCBI.
(Q2) Quelle variante de BLAST choisissez-vous ?
Voici les résultats obtenus avec les paramètres par défaut : [résultat]
(Q3) Quel "type" de résultat constatez-vous (analyser uniquement le dessin de distribution des hits) ? Comment expliquer cela ?
(Q4) Les Evalues des alignements associés obtenus contre la 1ere séquence trouvée de la banque ADY41274 sont-ils tous probants ? Ceux avec ACO48361 (1er alignement avec "boîtes bleux" entre la position 4500 et 9000 sur la query) le sont-ils tous également ? Expliquez.
(Q5) Même question que (Q4) mais désormais sur la qualité des alignements et leur bornes. Justifier ce résultat .
(Q6)
Nous souhaitons localiser les positions du CDS de manière plus précise à l'aide de GeneWise2 sur la protéine ADY41274.
(Q7) Décrire rapidement les étapes à réaliser sur l'interface Wise2 de Mobyle pour obtenir ce resultat.
Voici les résultats obtenus avec Wise2 : [résultat]
(Q8) Y a t'il des codons chevauchants deux exons selon Wise2 ? Lesquels ? Comment sont-il représentés sur le diagramme de Wise2 ?
(Q9) Les résultats de Wise2 sont-ils cohérents avec les précédents calculs de BLAST ? Y a t-il eu de nouveaux exons trouvés ? des alignements de BLAST exclus ? des exons raffinés ? Soyez précis sur cette analyse.
(Q10) Que peut-on dire du CDS obtenu avec WISE ? Est-il trouvé "complet" ? Quelle raison pourrait justifier l'absence éventuelle du début/fin du CDS par rapport au Contig ? Vous pouvez utiliser les résultats de Wise2 ainsi que ceux de Blast pour vous aider dans cette analyse.
Voici sa séquence :
> Protéine mystère [Arabidopsis thaliana] MSLQYHVLNSIPSTTFLSSTKTTISSSFLTISGSPLNVARDKSRSGSIHCSKLRTQEYIN SQEVQHDLPLIHEWQQLQGEDAPQISVGSNSNAFKEAVKSVKTILRNLTDGEITISAYDT AWVALIDAGDKTPAFPSAVKWIAENQLSDGSWGDAYLFSYHDRLINTLACVVALRSWNLF PHQCNKGITFFRENIGKLEDENDEHMPIGFEVAFPSLLEIARGINIDVPYDSPVLKDIYA KKELKLTRIPKEIMHKIPTTLLHSLEGMRDLDWEKLLKLQSQDGSFLFSPSSTAFAFMQT RDSNCLEYLRNAVKRFNGGVPNVFPVDLFEHIWIVDRLQRLGISRYFEEEIKECLDYVHR YWTDNGICWARCSHVQDIDDTAMAFRLLRQHGYQVSADVFKNFEKEGEFFCFVGQSNQAV TGMFNLYRASQLAFPREEILKNAKEFSYNYLLEKREREELIDKWIIMKDLPGEIGFALEI PWYASLPRVETRFYIDQYGGENDVWIGKTLYRMPYVNNNGYLELAKQDYNNCQAQHQLEW DIFQKWYEENRLSEWGVRRSELLECYYLAAATIFESERSHERMVWAKSSVLVKAISSSFG ESSDSRRSFSDQFHEYIANARRSDHHFNDRNMRLDRPGSVQASRLAGVLIGTLNQMSFDL FMSHGRDVNNLLYLSWGDWMEKWKLYGDEGEGELMVKMIILMKNNDLTNFFTHTHFVRLA EIINRICLPRQYLKARRNDEKEKTIKSMEKEMGKMVELALSESDTFRDVSITFLDVAKAF YYFALCGDHLQTHISKVLFQKV
(Q1) Comment pouvez-vous identifier sa fonction ? (Donnez juste la méthode)
(Q2) Analysez et interprétez les résultats de TopPred et de TMHMM.
(Q3) Analysez et interprétez les résultats de SignalP (aide). La protéine possède t-elle un peptide signal d’export extracellulaire ? Si oui, donnez la position du site de clivage.
(Q4) Analysez et interprétez les résultats de ChloroP (aide). La protéine possède t-elle un peptide transit pour son export dans le chloroplaste ? Si oui, donnez la position du site de clivage.
Nous allons maintenant étudier l’alignement de notre protéine avec 4 autres protéines de la même famille. Ces protéines ont la même structure et présentent les mêmes propriétés que notre protéine mystère
(Q6) A l’aide de quel(s) programme(s) (type(s) et nom(s)) pouvons-nous réaliser cet alignement ?
Voici le résultat de l’alignement des 5 séquences
(Q7) Quel est le plus long motif conservé entre ces séquences ?
(Q8) Par rapport à l’ensemble de la séquence, le début vous semble t-il conservé? Qu’en concluez-vous par rapport aux questions (Q3) - (Q4) ?