Examen de TD/TP - bio-informatique - MGM - 0506
Mode opératoire :
Vous rédigerez les réponses dans un fichier word que vous sauvegarderez régulièrement
dans le dossier Mes Documents. Donnez des captures au moins partielle de vos résultats pour les questions qui le justifient.
A la fin de l'examen, vous me l'enverrez en fichier attaché par email à l'adresse
noe@lifl.fr. Mettez [bioinfo:exam] Noms comme le sujet de votre email
Prévenez moi une fois l'email envoyé et attendez que je vous confirme sa réception avant de partir !!
Voici les outils dont vous allez peut-être avoir besoin pour répondre aux questions :
- Entrez
- SRS
- Align
- traduction
- InterPro
- ProSite
- Blast Contig
- ORF Finder
- signalP
- toppred2
- Kegg
- SRS:ClustalW,
Pasteur:ClustalW
Exercice 1 : interrogation de banques de séquences
- Q1. Via Entrez, lancez la requête MDH1[gene] et donnez
simplement le nombre d'entrées de séquences nucléiques/protéique
correspondant au gène MDH1. Que se passe t-il si l'on enlève
[gene] de la requête? A votre avis pourquoi?
- Q2. Via SRS, donnez le nombre d'entrées de séquences nucléiques
correspondant au gène MDH1 dans la banque EMBL
seule. Vous préciserez le type <Fields you can search>
(AllTest,ID,...) choisi.
- Q3. Via SRS, donnez le nombre d'entrées, et les séquences
nucléiques (format fasta) correspondant au gène MDH1
pour l'organisme Talaromyces emersonii dans la
banque EMBL. Interprétez ces résultats?
Exercice 2 : recherche d'exons
Voici un gène eucaryote (partiellement séquencé) et son ARN messager (complet) : gene.fas, mRNA.fas.
- Q1. Donnez un alignement global des deux séquences.
- Q2. Combien d'exons trouvez-vous à priori?
- Q3. Y a t-il eu des erreurs de séquençage?
- Q4. Traduisez la séquence mRNA.fas selon la 1ère phase
et donnez le résultat dans votre fichier word. Que signifie les caractères *
Exercice 3 : fonction d'une protéine
Voici un protéine d'un organisme Eucaryote : prot.fas
- Recherchez via InterproScan les domaines de cette protéine
- Q1. Obtenez les domaines/familles de cette séquence. Combien en obtenez vous ? Sont-ils pertinents ?
- Q2. Quelle semble être la fonction de cette protéine ?
- Q3. Consultez la seule entrée Prosite, et donnez le nombre de
faux positifs et de faux négatifs connus pour ce
motif. Décrire brièvement ce que signifient ces deux termes.
- Q4. Que constatez sur la troisième entrée InterPro L-lactate/malate dehydrogenase ?
Exercice 4 : identification d'une protéine
Nous avons séquencé une partie codante du génome d'Entamoeba histolytica : AGACAATATTAAATTTAGATATCCAACAAGACCAGAACAAGTTATTCTT
- Q1. Recherchez à l'aide de BLAST le/les contigs qui contiennent ce fragment et donnez leurs identifiants (ENT......)?
- Q2. Prenez le premier contig, et détectez le/les ORF(s) potentielle(s). Décrivez en deux lignes maximum comment vous avez obtenu le résultat, puis donnez votre résultat.
- Q3. Localisez et traduisez le/les ORF principales pour obtenir des séquences protéiques, puis utilisez BLAST afin de localiser des domaines communs/protéines communes?
- Q4. Quelles semblent être la/les fonctions associées ?
Exercice 5 : phylogénie

Nous allons étudier la phylogénie de deux espèces d'oiseaux qui
ont disparu avant la fin du 18ème siècle : le Dronte (Raphus
cucullatus) couramment appelé Dodo et le Solitaire de
Rodrigues (Pezophaps solitaria).
Ces deux espèces endémiques vivaient respectivement sur l'île maurice
et l'île rodrigue dans l'océan indien. Elles étaient incapables de
voler, et n'ont pu fuir l'homme et les prédateurs qu'il a introduit.
Voici un jeu de séquence d'oiseaux contenant ces deux espèces : dodo.fas.
- Q1. Donnez un alignement multiple des séquences
- Q2. Construisez un arbre phylogénétique en utilisant une méthode de maximum de vraisemblance, donnez le résultat obtenu et évaluez sa pertinence
- Q3. Que constatez vous sur l'arbre suivant
(phylogénie des deux espèces endémiques, espèces les plus proches, incohérences éventuelles)
- Q4. Recherchez sur Entrez la taxonomie de ces deux espèces et concluez
Last modified: Tue May 30 17:46:51 CEST 2006