Vous allez découvrir le portail Mobyle développé par l'Institut Pasteur de Paris. Il permet de lancer de nombreux programmes de bio-informatique et de mémoriser les résultats obtenus sur leur serveur.
Mobyle peut être utilisé sans s'identifier, mais la création d'un compte offre plusieurs avantages tels que la mémorisation de données et de résultats de programmes. N'importe qui peut créer un compte en fournissant un e-mail et un mot-de-passe.
Créer un compte Mobyle en suivant les instructions données sur le site web. Retenez bien votre mot-de-passe, nous utiliserons Mobyle lors de prochaines séances.
De nombreux programmes peuvent être utilisés via l'interface de Mobyle. Pour trouver un programme, vous pouvez, soit faire une recherche par mot-clé, soit explorer les catégories proposées.
Affichez le formulaire d'utilisation du programme
golden qui permet d'interroger les banques de séquences
par numéro d'accession.
A l'aide de ce formulaire, recherchez l'entrée EMBL de la
séquence nucléique portant le numéro d'accession Y10810
Le schéma suivant décrit les principaux éléments d'une page de résultats. Nous allons les tester pour prendre en main cette interface et pour manipuler différents modes de sauvegarde des données.
Sauvegardez l'entrée dans un fichier à l'aide du lien
"Save" (ne pas utiliser le bouton "Download").
Quel est le nom de ce fichier ?
Recherchez ce
fichier dans les répertoires de l'ordinateur et essayez de
l'ouvrir en cliquant dessus. Que se passe-t'il ?
En fait, les résultats sont sous la forme de texte brut,
mais le nom de fichier par défaut ne possède pas l'extension
".txt" mais ".out". Pour visualiser son contenu, il est possible que vous
ayez besoin d'ouvrir l'éditeur de texte Bloc-notes sous Windows
(ou son équivalent Gedit/Kedit/Kwrite sous Linux) puis
d'utiliser le menu "Fichier → Ouvrir" de ce logiciel, ou de
changer l'extension du fichier.
Malgré tout, il est possible que l'affichage ne passe pas
bien. Ceci est du au fait que les sauts de ligne ne sont pas
identiques d'un système d'exploitation à l'autre. C'est
pourquoi il est préférable d'utiliser le copier-coller.
Vous pouvez accéder aux résultats soit dans la zone
de texte dédiée, soit en les affichant dans une nouvelle
fenêtre (bouton "full screen view") afin de faciliter la
visualisation et les manipulations. En sélectionnant
l'ensemble des résultats, vous pouvez faire un copier-coller
texte dans le logiciel de votre choix.
Lancez d'une part le logiciel Bloc-notes
(ou son équivalent Linux), et d'autre part une traitement de texte tel que WordPad,
Word ou OpenOffice/LibreOffice, puis
copiez l'entrée dans l'un et dans l'autre logiciel.
Enfin enregistrez l'entrée dans les deux logiciels.
Vous avez créé un fichier texte ASCII brut à
l'aide du premier logiciel, et un document formaté à l'aide
du second logiciel.
En consultant le contenu de votre répertoire, comparez la taille (nombre de Ko) de ces deux fichiers. Bien qu'ils contiennent le même texte, est-ce que ces deux fichiers font la même taille ? Lequel est le plus grand ?
Lorqu'un compte utilisateur est ouvert sur Mobyle, un espace personnel est créé. Il permet de mémoriser, sur le serveur de Mobyle, les résultats que vous souhaitez consulter pendant plusieurs semaines. C'est très pratique si vous travaillez sur différents ordinateurs, par exemple en cours, au labo ou chez vous. Il suffit de vous connecter à Mobyle pour accéder à vos données, quelque soit l'ordinateur que vous utilisez. Cela se fait à l'aide du bouton "bookmark". Cela dit, il est préférable d'avoir donné un nom explicite aux résultats avant de les mémoriser dans votre espace Mobyle (le champ texte juste après le bouton "bookmark" as).
Mémorisez l'entrée dans votre espace personnel sous le nom Y10810. Elle va maintenant apparaitre dans la liste "Data Bookmarks" qui se trouve dans le bandeau de gauche, ainsi que sous l'onglet superieur "Data Bookmarks". Cet onglet permet de supprimer des données dont vous n'avez plus besoin. C'est tout pour l'instant, les bookmarks seront manipulés un peu plus tard.
Pour l'instant, nous avons utilisé un formulaire simple
(golden), qui ne demande pas de séquence. Nous allons
maintenant tester les différentes manières de fournir une
séquence ou une entrée de banque à un programme.
Pour faire ce test, nous allons utiliser le programme
extractfeat qui est capable de découper une séquence
à partir de critères sur les "features" (annotations de
banques). Le cadre "* sequence option" propose une liste
de modalités pour saisir la séquence, nous allons toutes les
tester.
Recherchez "extractfeat" parmi les programmes afin d'ouvrir son formulaire. Vous êtes alors dans l'onglet "Programs".
En cliquant sur l'onglet "Jobs", vous affichez de nouveau les résultats de golden et ainsi vous pouvez copier toute l'entrée Y10801 (obtenue précédemment). Ensuite, si vous cliquez sur l'onglet "Forms", ou dans le menu de gauche "Programs", vous accédez de nouveau au formulaire de "extractfeat". Vous pouvez alors coller l'entrée dans la zone de saisie appropriée.
Lancez les calculs avec les paramètres par défaut. Qu'obtenez-vous ? Que pouvez-vous en déduire sur le fonctionnement de "extractfeat" ?
En cliquant sur le bouton "back to form" qui se trouve vers le haut de la page de résultats, vous retournez au formulaire de saisie, pré-rempli avec les paramètres précédant. Pour les besoins de l'exercice, nous allons saisir de nouveau la séquence, en important un fichier.
Importez (bouton "upload") le fichier enregistré à l'aide du deuxième logiciel (traitement de texte).
Est-ce que cela fonctionne ? D'après-vous, pourquoi ?
Importez maintenant le fichier enregistré à l'aide du premier logiciel (texte ASCII brut).
Bloc-notes. Est-ce que cela fonctionne ?
Remarquez d'abord dans le fichier EMBL, la présence de deux features de type "CDS" :
...Saisissez ensuite "CDS" (Coding Sequence) dans "Type of feature to extract". Quelle est la différence avec les résultats obtenus précédemment ? Comment l'expliquez-vous ?
En cliquant sur le bouton "back to form" qui se trouve vers le haut de la page de résultats, vous retournez au formulaire de saisie, pré-rempli avec les paramètres précédant. Pour les besoins de l'exercice, nous allons saisir de nouveau la séquence, via l'onglet "Result". Lorsque vous choisissez sur ce mode, un nouveau menu déroulant apparaît. Il contient la liste des données que vous avez mémorisées dans les "bookmarks" et qui peuvent être utilisées par le programme ouvert.
Choisissez notre entrée préférée. Nous allons maintenant extraire uniquement la CDS du gène CPRF4b en saisissant "gene" dans "Tag of feature to extract" et "CPRF4b" dans "Value of feature tags to extract". En regardant l'explication donnée via les "?", vous comprendrez le sens de cette requête (il faut aussi connaître le cours sur les banques de données).
Relancez un formulaire vierge pour "extractfeat" et choisissez cette fois-ci "DB". Cela fait apparaître un menu déroulant accompagné d'une zone de saisie. Le menu permet de choisir la banque de données qui va être interrogée et la zone de saisie va recevoir le numéro d'accession de l'entrée à utiliser.
Demandez au programme de rechercher, de nouveau, l'entrée Y10810 dans la banque EMBL. Saisissez "0" dans l'option "Amount of sequence before feature to extract", "-3" dans l'option "Amount of sequence after feature to extract" et "CDS" dans l'option "Type of feature to extract". Qu'obtenez-vous ? Pourquoi s'agit-il du codon start ? Qu'obtenez vous alors en saisissant "-3" dans l'option "Amount of sequence before feature to extract", et "0" dans l'option "Amount of sequence after feature to extract".
Un des intérêts de Mobyle est de pouvoir utiliser les résultats d'un programme pour lancer directement le programme suivant. Nous allons tester cette possibilité. Pour ce faire, allez dans l'onglet "Jobs" et retrouvez le calcul que vous avez fait en demandant l'extraction complête des CDS de Y10810. La liste des programmes qui peuvent être lancés sur les séquences se situe juste en-dessous de l'affichage des résultats (menu à côté du bouton "further analysis") voir le schéma).
Choisissez le programme "transeq" qui traduit les séquences nucléiques sur l'extraction complète des CDS et validez à l'aide du bouton "further analysis". Puis lancez ce programme avec les paramètres par défaut.