Voici le numéro d'accession d'un contig du génome de Callithrix jacchus que nous allons analyser : ACFV01174462
(Q0) De quel Genre et Ordre fait parti Callithrix jacchus ? Quel est son nom commun ?
(Q1) Quelle est la taille (bp) de ce contig ?
Nous souhaitons d'abord confronter ce contig aux protéines de la banque ref_seq du NCBI.
(Q2) Quelle variante de BLAST choisissez vous ?
Voici les résultats obtenus avec les paramètres par défaut : [résultat]
(Q3) Quel "type" de résultat constatez-vous (analyser uniquement le dessin de distribution des hits) ? Comment expliquer cela ?
(Q4) Les Evalues et les alignements associés obtenus contre la séquence de la banque XP_002803157 sont-ils probants ? Ceux avec XP_002601903 le sont-ils également ? Expliquez.
(Q5)
Nous souhaitons dans un deuxième temps réaliser une prédiction ab-initio du gène trouvé en utilisant la version Eucaryote de GeneMark.hmm et GeneMark 2.4. Nous prendrons H. sapiens comme modèle dans les paramètres lorsque cela est demandé.
Voici les résultats obtenus avec les paramètres ci dessus : [résultat]
(Q6) Les résultats de GeneMark.hmm sont-ils en accord avec ceux estimés précédement ? Regardez en particulier les positions et sens des différents exons prédits.
(Q7) Les résultats de GeneMark 2.4 sont-ils en également en accord avec ceux estimés précédement ?
Nous souhaitons enfin localiser les positions du CDS de manière plus précise à l'aide de GeneWise sur la protéine XP_002761519.
(Q8) Les résultats sont-ils cohérents avec les précédents calculs ?
(Q9) Y a t'il des codons chevauchants deux exons selon Wise ? Lesquels ? Comment sont-il représentés sur le diagramme de Wise ?
Les microARN (miRNA) sont des ARN simple-brin, longs d'environ 21 à 24 nucléotides. Il existe plusieurs centaines de gènes de miRNA dans les génomes de la plupart des organismes pluricellulaires. Les miRNA contrôlent l'expression des gènes au niveau post-transcriptionnel : en s'appariant à des ARN messagers cibles, ils guident leur dégradation ou la répression de leur traduction en protéine. Ils sont produits à partir d’un ARN précurseur.
Voici la séquence d’un ARN précurseur de miRNA chez la plante modèle Arabidopsis thaliana (Les U ont été remplacés par des T) :
>ath-MIR171a-precurseur
ATGAGAGAGTCCCTTTGATATTGGCCTGGTTCACTCAGATCTTACCTGACCACACACGTA
GATATACATTATTCTCTCTAGATTATCTGATTGAGCCGCGCCAATATCTCAGTACTCTCT
CGT
Le dotplot suivant représente l’alignement de la séquence du précurseur contre elle-même.
(Q1) Interprétez le graphique. A quoi correspondent les traits sur les diagonales du graphique ?
(Q2) Confirmez à l’aide de mfold la structure de ce précurseur et schématiser la structure obtenue.
Le microARN produit à partir du précurseur est le suivant :
>miR171a
TGATTGAGCCGCGCCAATATC
Afin d’identifier la position du miRNA mature sur le précurseur, alignez à l’aide du programme de votre choix (sur le portail Mobyle) le précurseur et le miRNA.
(Q3) Quel type d’alignement avez-vous utilisé ? Quel programme avez vous utilisé ?
(Q4) Quelle est la position du miRNA sur son précurseur ?
A l’aide du programme Blast, vous allez identifier les ARNm cibles de ce microARN.
(Q5) Quel type de Blast utilisez-vous ?
Choisissez la banque refseq_rna et restreignez la requête à l’organisme Arabidopsis thaliana. Adaptez éventuellement la longueur du « K-mot » à la longueur de votre Query.
(Q6) Quelle est le numéro d’accession et la fonction de l’ARNm cible le plus probable?
(Q7) Quelle est la E-value obtenue pour cet alignement?
(Q8) Quel est le pourcentage d’identité avec la séquence du microARN ?