Voir le sujet du TP.
Questions 1 et 2. Les séquences des chaines alpha et beta de l'hémoglobine sont dans ce fichier. La chaine alpha contient 141 acides aminés, et la chaine beta 146.
Question 3. L'alignement de la chaine alpha de l'hémoglobine
normale avec la chaine alpha de l'hémoglobine S ne fait pas apparaitre
d'anomalie. La seule différence est que la séquence de l'hémoglobine S
commence par un M (pour l'acide aminé méthionine). Mais la méthionine
étant l'acide aminé codé par le codon START (voir le code génétique), toutes
les protéines commencent par M. Si la séquence de l'hémoglobine que
vous avez téléchargée sur PDB ne mentionne ce M, c'est simplement une
question de convention.
Alignement des deux chaines alpha
hemoglobine S 1 MVLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFDLS 50
|||||||||||||||||||||||||||||||||||||||||||||||||
hemoglobine 1 VLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFDLS 49
hemoglobine S 51 HGSAQVKGHGKKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFK 100
||||||||||||||||||||||||||||||||||||||||||||||||||
hemoglobine 50 HGSAQVKGHGKKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFK 99
hemoglobine S 101 LLSHCLLVTLAAHLPAEFTPAVHASLDKFLASVSTVLTSKYR 142
||||||||||||||||||||||||||||||||||||||||||
hemoglobine 100 LLSHCLLVTLAAHLPAEFTPAVHASLDKFLASVSTVLTSKYR 141
Pour la chaine beta, il y a une mutation ponctuelle en position 6 : l'acide aminé E de la chaine normale est muté en V sur la chaine de l'hémoglobine S.
hemoglobine S 1 MVHLTPVEKSAVTALWGKVNVDEVGGEALGRLLVVYPWTQRFFESFGDLS 50
|||||.|||||||||||||||||||||||||||||||||||||||||||
hemoglobine 1 VHLTPEEKSAVTALWGKVNVDEVGGEALGRLLVVYPWTQRFFESFGDLS 49
hemoglobine S 51 TPDAVMGNPKVKAHGKKVLGAFSDGLAHLDNLKGTFATLSELHCDKLHVD 100
||||||||||||||||||||||||||||||||||||||||||||||||||
hemoglobine 50 TPDAVMGNPKVKAHGKKVLGAFSDGLAHLDNLKGTFATLSELHCDKLHVD 99
hemoglobine S 101 PENFRLLGNVLVCVLAHHFGKEFTPPVQAAYQKVVAGVANALAHKYH 147
|||||||||||||||||||||||||||||||||||||||||||||||
hemoglobine 100 PENFRLLGNVLVCVLAHHFGKEFTPPVQAAYQKVVAGVANALAHKYH 146
Question 4. Sur la matrice BLOSUM 62, le score de similitude entre E et V est égal à -2. C'est un score négatif, qui indique que ces deux acides aminés sont dissemblables. Quand on regarde les propriétés physico-chimiques donnés par le tableau, il apparait que
Question 5. D'après PDB, l'acide aminé E qui est atteint par la mutation est situé en début d'une hélice alpha. Son environnement (L,T,P,E,K,S) tend à être légèrement hydrophobe. La mutation de E en V (qui est hydrophobe, alors que E ne l'est pas) accentue ce caractère. Les régions hydrophobes ont tendance à ne pas rester exposées au solvant (l'eau de la cellule), et à apparaitre au coeur de la molécule, ou à former ds complexes avec d'autres molécules.
Question 6. L'acide aminé est à la surface de la protéine, dans une région qui peut facilement interagir avec d'autres molécules. Conjugué au fait que la mutation de l'hémoglobine S accentue le caractère hydrophobe de la région, cette observation permet de faire l'hypothèse que la mutation entraine un changement de configuration. C'est effectivement le cas. La première figure ci-dessus montre la structure d'une hémoglobine normale, composée de quatre peptides (les deux chaines alpha en bleu marine et en vert, les deux chaines beta en jaune et en bleu clair) et de quatre hèmes (en gris). Les deux sphères orange en haut sont des groupes phosphates. Encadrée en rouge apparait la région touchée par la mutation de l'anémie falciforme. La seconde figure montre comment l'organisation spatiale des deux chaines beta est affectée par la mutation. La mutation ponctuelle entraine une deformation locale de la chaine, qui devient complémentaire à l'autre chaine. Les deux peptides s'agglomèrent comme deux briques de Lego. Les hémoglobines S ont ainsi tendance à s'agréger entre elles en déformant le globule rouge, expliquant le phénomène de faucille.
![]() |
![]() |
| Figure 6: structure de l'hémoglobine A Source: PDB, identifiant 4HHB |
Figure 7: deux hémoglobines S agrégées Source: PDB, identifiant 2HBS |
Question 7. D'après le code génétique, E peut etre codé par GAA ou GAG et V peut etre codé par GUU, GUC, GUA et GUG.On peut faire l'hypothèse que les modifications les plus vraisemblables au niveau de l'ADN sont celles qui demandent le moins de mutations. C'est le principe d'économie du rasoir d'Ockham: l'explication la plus simple est la plus probable. Dans ce cadre, on peut avoir un changement de GAA en GUA, ou de GAG en GUG. Dans les deux cas, il suffit d'une seule mutation, de A en U.
Questions 8 et 9. Il y a deux entrées répondant aux mots clés hemoglobin beta, toutes les deux sur le chromosome 11.
Question 10. Les gènes sur le chromosome 11 voisins de celui de l'hémoglobine beta sont également des gènes codant pour des protéines participant à la constitution de l'hémoglobine à des stades différents du développement, ou des pseudogènes dérivés de gènes de l'hémoglobine. Il est fréquent de voir des gènes participant à des fonctions proches rassemblés sur le génome.
Question 11. Le gène a trois exons (les trois rectangles rouges), et deux introns. En bleu figurent les régions non traduites, en 5' et en 3' de la partie codante.
Question 12. L'identifiant de la séquence du gène est NM000518. La séquence est disponible dans ce fichier.
Question 13. On a vu en question 2 que la chaine beta de l'hémoglobine faisait 146 acides aminés. Il s'ensuit que la partie codante du gène fait 146 x 3 nucléotides, soit 438 nucléotides.
Question 14. Pour localiser le gène, on recherche tous les codon START possibles, et pour chacun, on regarde sur les premiers codons s'il y a correspondance avec la séquence protéique. Le premier codon STOP dans la même phase de lecture apparait bien 146 codons plus tard.
ACATTTGCTTCTGACACAACTGTGTTCACTAGCAACCTCAAACAGACACC ATG GTG CAT CTG ACT CCT GAG GAG
M V H L T P E E
AAG TCT GCC GTT ACT GCC CTG TGG GGC AAG GTG AAC GTG GAT GAA GTT GGT GGT GAG GCC CTG
K S A V T A L W G K V N V D E V G G E A L
GGC AGG CTG CTG GTG GTC TAC CCT TGG ACC CAG AGG TTC TTT GAG TCC TTT GGG GAT CTG TCC
G R L L V V Y P W T Q R F F E S F G D L S
ACT CCT GAT GCT GTT ATG GGC AAC CCT AAG GTG AAG GCT CAT GGC AAG AAA GTG CTC GGT GCC
T P D A V M G N P K V K A H G K K V L G A
TTT AGT GAT GGC CTG GCT CAC CTG GAC AAC CTC AAG GGC ACC TTT GCC ACA CTG AGT GAG CTG
F S D G L A H L D N L K G T F A T L S E L
CAC TGT GAC AAG CTG CAC GTG GAT CCT GAG AAC TTC AGG CTC CTG GGC AAC GTG CTG GTC TGT
H C D K L H V D P E N F R L L G N V L V C
GTG CTG GCC CAT CAC TTT GGC AAA GAA TTC ACC CCA CCA GTG CAG GCT GCC TAT CAG AAA GTG
V L A H H F G K E F T P P V Q A A Y Q K V
GTG GCT GGT GTG GCT AAT GCC CTG GCC CAC AAG TAT CAC TAA GCTCGCTTTCTTGCTGTCCAATTTCTA
V A G V A N A L A H K Y H *
TTAAAGGTTCCTTTGTTCCCTAAGTCCAACTACTAAACTGGGGGATATTATGAAGGGCCTTGAGCATCTGGATTCTGCCTAAT
AAAAAACATTTATTTTCATTGC
Le codon qui porte la mutation est GAG (en rouge ci-dessus). Le gène de l'hémoglobine S contient donc très vraisemblement le codon GUG (ou GTG) à la place.
T P E E K
hemoglobine normale ACT CCT GAG GAG AAG
||| ||| | | ||| |||
hemoglobine S ACT CCT GTG GAG AAG
T P V E K