Contrôle de TP - M1-GenPro (année 2011-2012)

Les documents de cours et TDs sont autorisés ainsi que les documents du web. Les différentes parties sont indépendantes. Il est conseillé de lire chaque partie (rapide survol) avant de la commencer.

Partie 1 : Analyse d'un contig de Callithrix jacchus

Voici le numéro d'accession d'un contig du génome de Callithrix jacchus que nous allons analyser : ACFV01174462

(Q0) De quel Genre et Ordre fait parti Callithrix jacchus ? Quel est son nom commun ?

(Q1) Quelle est la taille (bp) de ce contig ?

Nous souhaitons d'abord confronter ce contig aux protéines de la banque ref_seq du NCBI.

(Q2) Quelle variante de BLAST choisissez vous ?

Voici les résultats obtenus avec les paramètres par défaut : [résultat]

(Q3) Quel "type" de résultat constatez-vous (analyser uniquement le dessin de distribution des hits) ? Comment expliquer cela ?

(Q4) Les Evalues et les alignements associés obtenus contre la séquence de la banque XP_002803157 sont-ils probants ? Ceux avec XP_002601903 le sont-ils également ? Expliquez.

(Q5)

(a) Donnez le sens du gène sur ce contig. Est-ce cohérent ou surprenant ? Expliquez.
(b) Estimez et donnez de manière assez empirique (~dizaine de bases près) les positions de début ou fin des exons sur le contig en utilisant la séquence XP_002761519, (ainsi que d'autres au besoin) : combien d'exons (au minimum) attendez vous sur ce gène ? Pourquoi ne sont-ils pas sur la même phase ?
(c) A-t-on à priori trouvé la totalité des exons et du CDS ?


Nous souhaitons dans un deuxième temps réaliser une prédiction ab-initio du gène trouvé en utilisant la version Eucaryote de GeneMark.hmm et GeneMark 2.4. Nous prendrons H. sapiens comme modèle dans les paramètres lorsque cela est demandé.

Voici les résultats obtenus avec les paramètres ci dessus : [résultat]

(Q6) Les résultats de GeneMark.hmm sont-ils en accord avec ceux estimés précédement ? Regardez en particulier les positions et sens des différents exons prédits.

(Q7) Les résultats de GeneMark 2.4 sont-ils en également en accord avec ceux estimés précédement ?


Nous souhaitons enfin localiser les positions du CDS de manière plus précise à l'aide de GeneWise sur la protéine XP_002761519.

(Q8) Les résultats sont-ils cohérents avec les précédents calculs ?

(Q9) Y a t'il des codons chevauchants deux exons selon Wise ? Lesquels ? Comment sont-il représentés sur le diagramme de Wise ?

Partie 2 : Etude d’un microARN et de son précurseur

Les microARN (miRNA) sont des ARN simple-brin, longs d'environ 21 à 24 nucléotides. Il existe plusieurs centaines de gènes de miRNA dans les génomes de la plupart des organismes pluricellulaires. Les miRNA contrôlent l'expression des gènes au niveau post-transcriptionnel : en s'appariant à des ARN messagers cibles, ils guident leur dégradation ou la répression de leur traduction en protéine. Ils sont produits à partir d’un ARN précurseur.

Voici la séquence d’un ARN précurseur de miRNA chez la plante modèle Arabidopsis thaliana (Les U ont été remplacés par des T) :

	>ath-MIR171a-precurseur
	ATGAGAGAGTCCCTTTGATATTGGCCTGGTTCACTCAGATCTTACCTGACCACACACGTA
	GATATACATTATTCTCTCTAGATTATCTGATTGAGCCGCGCCAATATCTCAGTACTCTCT
	CGT
      

détermination de la structure du précurseur et de la position du miRNA

Le dotplot suivant représente l’alignement de la séquence du précurseur contre elle-même.

(Q1) Interprétez le graphique. A quoi correspondent les traits sur les diagonales du graphique ?

(Q2) Confirmez à l’aide de mfold la structure de ce précurseur et schématiser la structure obtenue.

Le microARN produit à partir du précurseur est le suivant :

	>miR171a
	TGATTGAGCCGCGCCAATATC
      

Afin d’identifier la position du miRNA mature sur le précurseur, alignez à l’aide du programme de votre choix (sur le portail Mobyle) le précurseur et le miRNA.

(Q3) Quel type d’alignement avez-vous utilisé ? Quel programme avez vous utilisé ?

(Q4) Quelle est la position du miRNA sur son précurseur ?

identification des cibles potentielles du miRNA

A l’aide du programme Blast, vous allez identifier les ARNm cibles de ce microARN.

(Q5) Quel type de Blast utilisez-vous ?

Choisissez la banque refseq_rna et restreignez la requête à l’organisme Arabidopsis thaliana. Adaptez éventuellement la longueur du « K-mot » à la longueur de votre Query.

(Q6) Quelle est le numéro d’accession et la fonction de l’ARNm cible le plus probable?

(Q7) Quelle est la E-value obtenue pour cet alignement?

(Q8) Quel est le pourcentage d’identité avec la séquence du microARN ?

Fin des hostilités, année 2011-2012