Licence-Master - Bioinformatique

TP 2 : l'anémie falciforme

L'anémie falciforme (ou drépanocytose) est une maladie génétique qui se manifeste à travers de multiples symptomes: douleurs articulaires intenses, anémie chronique, susceptibilité accrue aux infections,... Elle nécessite un suivi médical lourd. Le but de ce TP est de retracer l'histoire de la découverte de cette maladie et de ses mécanismes.

Le premier cas documenté remonte à 1910. Le docteur J.B. Herrick de l'hopital de Chicago examine un patient de 20 ans originaire d'Inde qui présente des troubles atypiques:

 
"The young man reported that he had been laid up in a hospital with
what he called muscular rhumatism. His illness had begun with malaise,
pain in the back, the muscles of the legs and arms. He had a slight
fever and was pale ...  He was still, he said, somewhat short of
breath."

Le médecin réalise un bilan sanguin complet. L'examen au microscope révèle que les globules rouges sont en nombre normal, mais qu'ils présentent une allure aplatie en forme de faucille. Ils sont également plus rigides. De ce fait, ils ont tendance à bloquer les vaisseaux sanguins et gênent la circulation sanguine. Un globule rouge normal est au contraire rond et d'une grande plasticité pour pouvoir circuler sans encombre dans les capillaires les plus fins.

Figure 1: globules rouges normaux et
globules rouges en faucille
Figure 2: gros plan Figure 3: simulation de l'encombrement
des vaisseaux sanguins

D'autres cas sont peu à peu diagnostiqués, et rapidement deux observations sont manifestes:

  1. les patients sont originaires de régions tropicales, d'Afrique ou d'Inde plus particulièrement.
  2. il y a des familles dont plusieurs membres souffrent de l'anémie falciforme, alors que d'autres familles semblent épargnées.
Le second point fait naturellement pensé à une maladie génétique. Toutefois, une maladie familiale n'est pas nécessairement d'origine génétique. Elle peut etre causée par des facteurs environnementaux, tels que l'alimentation. En 1941, James Van Neel se livre à une analyse de pedigrees de familles touchées par l'anémie falciforme. Ses conclusions indiquent que la maladie est bien transmise de manière héréditaire suivant un modèle mendélien.

Reste à comprende les mécanismes moléculaires qui provoquent le comportement déficient des globules rouges. Les globules rouges sont des cellules composées essentiellement d'hémoglobine, la protéine chargée du transport de l'oxygène des poumons aux autres organes (chaque globule rouge contient environ 300 000 000 hémoglobines). Ils sont dénuées de noyau et d'organites.

En 1949, Linus Pauling et son équipe mettent en évidence que l'hémoglobine extraites des cellules déformées est qualitativement différente de l'hémoglobine de cellules normales. Elle à une charge électrique différentes, et les deux types d'hémoglobine peuvent donc être séparés par électrophorèse. L. Pauling obtiendra en 1954 le prix Nobel de chimie pour ses travaux sur les protéines, l'hémoglobine en particulier.

On appelle hémoglobine S (S pour sickle=faucille en anglais) l'hémoglobine morbide, et hémoglobine A la forme normale.

1. Séquence et structure de l'hémoglobine

L'hémoglobine est un tétramère, c'est-à-dire qu'elle est formée de quatre chaines peptidiques, deux chaines dites alpha (identiques l'une à l'autre) et deux chaines dites bêta (également identiques). On trouve aussi quatre groupements organiques, appelés hèmes, contenant chacun un atome de fer. C'est à ce niveau que se lie l'oxygène.

Figure 4: les 4 chaines peptidiques de l'hémoglobine
avec les 4 hèmes
Figure 5: gros plan sur un hème

Dans cette première section, vous allez étudier l'hémoglobine à partir des informations disponibles dans les banques de données moléculaires.

Question 1. Le site PDB (Protein Data Bank) est une base de données qui recense des informations sur les séquences et les structures des protéines. Faites une recherche avec l'identifiant 4HHB (pour Human Hemoglobin - version 4). Sélectionnez ensuite l'onglet Sequence details.

Question 2. Récuperez les séquences de l'hémoglobine alpha (chaine A) et de l'hémoglobine beta (chaine B) au format fasta, et sauvegardez-les. De combien d'acides aminés est composé chacun de ces deux peptides ?

La séquence de l'hémoglobine S est disponible dans ce fichier.

Question 3. Utilisez le programme Align pour comparer la chaine alpha de l'hémoglobine A avec la chaine alpha de l'hémoglobine S, puis la chaine beta de l'hémoglobine A avec la chaine beta de l'hémoglobine S. Laquelle des deux chaines est-elle touchée ? Quel type de mutation observe-t-on ? Notez bien les positions.

La maladie est donc causée par la mutation d'un unique acide aminé. Mais cette simple substitution suffit à confèrer à l'hémoglobine S une charge électrique globale inférieure à celle de l'hémoglobine A. Il en résulte que lorque les deux hémoglobines sont placées sur un gel d'électrophorèse, elles ne migrent pas de la meme façon. C'est ce qui avait permis à L. Pauling de mettre en évidence l'implication de l'hémoglobine. La mutation a ensuite été isolée par V. Ingram à la fin des années 50, avant même que la séquence de l'hémoglobine soit connue (pour mémoire, la première protéine séquencée est l'insuline, obtenue par Sanger en 1955). V. Ingram a raffiné l'expérience de L. Pauling sur des fragments de la chaine beta de l'hemoglobine obtenus par digestion.

Une substitution, c'est un changement minime au niveau de la séquence. Pour comprendre son impact, il faut analyser le changement de conformation spatiale que cela peut induire.

Question 4. Quelle information donne la matrice BLOSUM 62 sur la mutation ? Quelles sont les propriétés physico-chimiques de chacun des deux acides aminés ?

La fiche de PDB donne également des informations sur la structure secondaire de la protéine: position des hélices alpha, des coudes.

Question 5. Dans quel élément de structure l'acide aminé portant la mutation est-il impliqué ? Son environnement est-il hydrophile, hydrophobe ?

Il est également possible d'observer la molécule en 3D, avec l'applet JMol (menu de droite dans la fiche PDB).

Question 6. Lancez Jmol. Le bouton gauche de la souris permet de faire pivoter la molécule dans l'espace. Le bouton droit fait apparaitre un menu, avec notamment des possibilités de zoom. Cliquer sur avec le bouton droit de la souris permet d'afficher l'acide aminé courant et sa position, en bas à gauche. Localisez une chaine de type beta (C ou D), puis sur cette chaine la position mutée. L'acide aminé touché se trouve-t-il à la surface ou au coeur de la molécule ?

Figure 6: structure de l'hémoglobine A
Source: PDB, identifiant 4HHB
Figure 7: deux hémoglobines S agrégées
Source: PDB, identifiant 2HBS

La mutation atteint une région exposée, à la surface de la protéine. La première figure ci-dessus montre la structure d'une hémoglobine normale, composée de quatre peptides (les deux chaines alpha en bleu marine et en vert, les deux chaines beta en jaune et en bleu clair) et de quatre hèmes (en gris). Les deux sphères orange en haut sont des groupes phosphates. Encadrée en rouge apparait la région touchée par la mutation de l'anémie falciforme. La seconde figure montre comment l'organisation spatiale des deux chaines beta est affectée par la mutation. La mutation ponctuelle entraine une deformation locale de la chaine, qui devient complémentaire à l'autre chaine. Les deux peptides s'agglomèrent comme deux briques de Lego. Les hémoglobines S ont ainsi tendance à s'agréger entre elles en déformant le globule rouge, expliquant le phénomène de faucille.

2. Le gène de l'hémoglobine beta

L'étape suivante dans la compréhension de la maladie est de regarder ce qui se passe au niveau du gène, ce qui permettra éventuellement de proposer des thérapies ou des tests de dépistage (voir section 4).

Question 7. Sans connaissance de la séquence nucléique, peut-on à partir du code génétique dire quelle est la mutation (ou les mutations) les plus probables ?

Le génome humain est disponible sur le portail Human Genome Project.

Question 8. Faites une recherche avec les mots clés hemoglobin beta, en sélectionnant l'assemblage reference (pour éviter les réponses redondantes). Le champ chromosome est optionnel.

Question 9. Sur quel chromosome se trouve le gène de l'hémoglobine beta ?

Question 10. En cliquant sur le numéro du chromosome, vous accédez à l'environnement du gène. Quels sont les autres gènes dans le voisinage de l'hémoglobine beta ?

Sélectionnez le gène de l'hémoglobine beta.

Question 11. Combien le gène a-t-il d'exons et d'introns?

Question 12. Récupérez la séquence de l'ARN messager en cliquant sur l'identifiant de type NM_ (labelé mRNA link), et en sélectionnant fasta. Sauvegardez-la.

Cette séquence correspond à l'ARN messager mature, après épissage, telle qu'elle est présentée au ribosome pour traduction. Elle comprend donc les régions 5' et 3' non traduites et la partie codante, mais pas les introns.

Question 13. A partir seulement des informations que vous avez rassemblées dans les questions précédentes, pouvez-vous en déduire quelle est la longueur de la partie codante ?

Question 14. Sur la séquence de l'ARN messager, en vous aidant de la séquence protéique, localisez le codon START, le codon STOP, ainsi que le codon qui code pour l'acide aminé impliqué. Quelle est finalement la mutation ? Cela est-il cohérent avec les conclusions de la question 8 ?

3. Transmission génétique

Le gène de l'hémoglobine beta est donc porté par le chromosome 11. Un individu peut ainsi avoir l'un des trois génotypes suivants:

Question 15. D'après les informations que vous avez collectées jusqu'à maintenant, peut-on dire si un homme et une femme peuvent être également atteints par l'anémie falciforme ?

Pour savoir si la forme S est dominante ou récessive, il faut faire des études familiales, ce qui permet d'étudier le mode de transmission. La figure reproduit le pedigree de deux familles touchées par l'anémie falciforme. Les cercles correspondent aux femmes, et les carrés aux hommes. Les individus atteints par la maladie apparaissent en rouge.
Figure 8: pedigree des familles Nguyen et Fielder

Question 16. D'après ces pedigrees, peut-on dire si le gène HbS est récessif ou dominant ? Quel est le génotype des individus malades, des porteurs sains ?

Question 17. Donnez le génotype (ou les génotypes possibles) de chacun des membres des familles Nguyen et Fielder.

Question 18.: Si Kim et Scott avaient un enfant, quelle est la probabilité que ce dernier soit porteur de la maladie ? Qu'il soit porteur sain ?

4. Diagnostic de la maladie

La connaissance au niveau du génome de la mutation qui provoque la maladie permet un dépistage précoce, et donc une prise en charge médicale anticipée, ce qui peut améliorer le pronostic vital. Le gène de l'hémoglobine beta ne s'exprime que plusieurs semaines après la naissance, et l'examen sanguin des nouveaux-nés atteints ne révèlent donc aucune anomalie. Il faut faire un test ADN.

Le protocole le plus fréquent est d'effectuer une analyse de restriction, qui permet de savoir si un des deux (ou les deux) allèle est porteur de la mutation. D'un point de vue expérimental, la méthode comprend trois étapes:

  1. Pour avoir suffisamment d'ADN, on amplifie la séquence autour de la position où peut se produire la mutation par PCR (polymerase chain reaction).
  2. Les copies d'ADN obtenues sont ensuite soumises à une digestion enzymatique par une enzyme de restriction, qui va cliver la séquence en reconnaissant un motif spécifique de 5 à 8 bases. Ce motif dépend de l'enzyme de restriction utilisée.
  3. Si une mutation ponctuelle modifie le site de restriction initial, la taille des fragments d'ADN obtenus après digestion sera modifiée et décelable après électrophorèse des fragments d'ADN.

Question 19. Isoler sur la séquence de l'ARN messager le segment d'ADN qui doit être digéré par l'enzyme.

Question 20. Le logiciel restrict permet d'identifier sur une séquence tous les sites de restriction potentiels pour un ensemble d'enzymes de restriction couramment commercialisées. Faites une recherche avec restrict pour voir quelle(s) enzyme(s) utiliser dans la détection de la mutation de l'anémie falciforme. Le résultat est disponible dans le fichier outfile.out

Question 21. Quelle allure aura le gel d'un individu AA, AS, SS ?

5. Géographie de l'anémie falciforme

Pour conclure ce TP, il reste une question en suspens: la relation entre l'avénement de la maladie et l'origine géographique des malades. La réponse réside dans ces deux cartes.

Figure 9: répartition géographique de l'anémie falciforme

Figure 10: répartition du paludisme

La première indique la proportion d'individus porteurs de l'allèle S dans population en fonction de la localisation. La seconde montre les régions où le paludisme (la malaria) est endémique. Il y a manifestement une corrélation entre les deux.

Il est peu probable que l'anémie falciforme soit causée directement par le paludisme, puisque c'est une maladie génétique qui atteint systématiquement les individus SS. Au contraire, en 1946, le docteur E.A. Beet en poste en Rhodésie du Nord (à l'époque un protectorat britannique - actuellement la Zambie et le Zimbabwee) notait que parmi les patients de son hopital, 15.3% des individus AA étaient touchés par le paludisme, tandis que seuls 9.8% des individus AS ou SS étaient atteints. La corrélation entre la fréquence d'occurrence du paludisme et de l'anmémie falciforme pourrait donc plutot s'expliquer comme le résultat d'une adaptation évolutive. L'hypothèse est que l'allèle muté S s'est maintenu à un taux élevé dans le pool génique des populations exposées au paludisme en raison de l'avantage sélectif qu'il confère. En effet, le parasite responsable du paludisme, le plasmodium, se révèle moins pathogène chez les porteurs de l'allèle muté. Le plasmodium infecte les globules rouges, et ne survit pas dans les cellules déformées et rigides. Les porteurs sains AS sont donc plus résistants au paludisme, tout en ne développant pas d'anémie falciforme, puisque la forme S est récessive. En revanche, les individus de type SS sont affligés de handicaps sévères. Ce sont les grandes victimes de cette évolution.