2. Une science fondée sur l'identification et la recombinaison des gènes
Chez tous les êtres vivants quels qu'ils soient, l'information génétique est contenue dans les gènes, constitués d'ADN, présents dans chaque cellule de l'organisme. Ces gènes " s'expriment " en permettant la synthèse des protéines constitutives des tissus vivants.
a) Un aperçu du fonctionnement du vivant6( * )
Qu'est-ce qu'un gène ?
Le gène peut être défini comme "
un segment d'ADN
qui code une protéine et l'ensemble des séquences
régulatrices, constituant ainsi une
unité
d'information
génétique
"
7(
*
)
.
Plus précisément, les gènes sont constitués de
brins d'acides nucléiques, eux-mêmes composés d'une
succession de nucléotides, unis les uns aux autres par des liaisons
" phosphodiesters ". Chaque nucléotide se compose notamment de
" bases " qui lui confèrent une identité.
Ces bases sont au nombre de quatre, dénommées par les lettres A,
T, G, C, pour l'ADN, et A, U, G, C pour l'ARN. C'est l'ordre dans lequel se
trouvent ces bases qui constitue l'information codée des gènes.
" On peut donc comparer l'ADN à une bande magnétique :
la chaîne de phosphate-ribose
[sous-jacente]
étant
l'équivalent du support plastique et l'ordre des bases
l'équivalent de la position des petits grains magnétisés
collés sur la bande plastique "
8(
*
)
.
L'ADN est le plus souvent sous forme de double brin, s'appariant grâce
à la " complémentarité des bases ", A avec T et
G avec C.
Une caractéristique remarquable des gènes, qui mérite
d'être soulignée d'emblée, est
l'universalité du
code génétique
: en effet, quelles que soient les
espèces, les gènes sont toujours formés de cet assemblage
de nucléotides (A,T,G,C), chaque gène étant défini,
rappelons-le, par l'ordre d'enchaînement de ces nucléotides.
Il n'y a donc pas de différence fondamentale entre la nature des
gènes des différentes espèces
. Seuls le nombre et la
complexité des gènes différent : le patrimoine
génétique d'une bactérie est 100 fois plus complexe
que celui d'un virus, celui d'un mammifère 100.000 fois plus
complexe que celui d'un virus
9(
*
)
.
Ce patrimoine génétique est appelé le génome.
Le génome
10(
*
)
Au sens strict, le génome est l'ensemble des gènes d'un
organisme, rassemblés sous forme de chromosomes : les gènes sont
localisés dans le noyau des cellules chez les organismes
" eucaryotes " (levures, plantes, animaux) et dans l'espace
intracellulaire pour les cellules qui n'ont pas de noyau, les
" procaryotes " (bactéries).
Chez les organismes supérieurs à reproduction sexuée,
chaque chromosome (et donc chaque gène) est présent en double
exemplaire : l'un qui provient de la mère, l'autre du père. Les
gènes homologues sont appelés " allèles ".
La taille des génomes varie -on l'a vu- selon les organismes. Celui de
certains virus bactériens ne contient que trois gènes,
contrastant avec celui, bien plus important, des mammifères.
"
Les chaînes d'ADN renfermées dans les chromosomes de
chacune de nos cellules font plus d'un mètre de long
. Si l'on
devait écrire la formule chimique du génome humain (contenu donc
dans chaque cellule) sous sa forme la plus condensée (à l'aide
des lettres ATGC), il faudrait de nombreux volumes qui tiendraient sur une
étagère de 50 mètres de long
"
11(
*
)
.
Le génome humain contient en effet environ 100.000 gènes,
soit 3 milliards de bases (présents dans chaque cellule). Seulement
20.000 gènes sont toutefois exprimés.
Le code génétique
Le code génétique est le système de correspondance entre
les séquences de nucléotides de l'ADN et les protéines
synthétisées, composées d'acides aminés. On sait en
effet depuis une dizaine d'années environ qu'à trois bases
successives correspondent un acide aminé, comme indiqué dans le
tableau suivant :
TABLEAU DE CODE GÉNÉTIQUE :
CORRESPONDANCE
ENTRE BASES ET ACIDES AMINÉS
Base ou nucléotide initial |
Base ou nucléotide central |
Base ou nucléotide final |
|||
|
U |
C |
A |
G |
|
U |
Phe
|
Ser
|
Tyr
|
Cys
|
U
|
C |
Leu
|
Pro
|
His
|
Arg
|
U
|
A |
Ileu
|
Thr
|
AspN
|
Ser
|
U
|
G |
Val
|
Ala
|
Asp
|
Glt
|
U
|
Tableau tiré de : " génétique moléculaire ", Encyclopédia Universalis |
|||||
Ala :
alanine
|
Glu :
acide glutamique
|
Leu :
leucine
|
Ser :
sérine
|
||
Un acide aminé est codé par trois bases prises dans l'ordre suivant, de gauche à droite : la base initiale à gauche, la base centrale dans l'une des quatre colonnes du centre, et la base terminale à droite ; ainsi on voit que UUU correspond à la phénylalanine (Phe) ; CUU à leucine (Leu), etc... Les trois triplets qualifiés de " non-sens " servent de signaux de ponctuation. |
Le
code génétique est universel
12(
*
)
, c'est-à-dire qu'il est le
même dans toutes les espèces. En conséquence, un
gène d'une espèce introduit dans le génome d'une autre
espèce codera pour les mêmes acides aminés
c'est-à-dire pour la même protéine que dans l'espèce
de départ (toutefois sous certaines conditions, et notamment
l'adaptation du gène " promoteur " (cf. ci-après).
Autour de ces " messages génétiques codés " que
constituent les associations de bases " signifiantes ", existent, sur
le brin d'ADN,
des régions régulatrices,
chargées
de régler l'expression des gènes considérés. On
trouvera ainsi, en amont d'une région codante, un gène
" promoteur ", et en aval, un gène " terminateur ",
indiquant respectivement le début et la fin du message
génétique.
L'expression génétique
Un fragment d'ADN est une information inerte tant que le message qu'il contient
n'a pas été " exprimé ", c'est-à-dire
décodé par une cellule.
L'expression génétique est "
l'ensemble des
mécanismes qui permet à un gène de délivrer son
message
"
13(
*
)
et de
devenir opérationnel, c'est-à-dire de déclencher la
production de la protéine qu'il code.
Le mécanisme très complexe qui est à l'oeuvre peut
être résumé de la façon suivante : lorsqu'un
gène doit s'exprimer,
il est préalablement copié
,
sous la forme d'une molécule d'acide ribonucléique messager, ou
ARNm, qui contient lui-même un message codé,
décrypté dans le cytoplasme des cellules, c'est-à-dire
hors du noyau cellulaire, par un système de décodage
constitué de ribosomes et d'ARN de transfert. Ce procédé
donne naissance à la protéine
, qui exécute
concrètement le programme contenu dans le gène.
De cette façon, l'information génétique contenue dans
l'ADN n'est pas altérée.
Ce mécanisme peut être ainsi schématisé :
L'EXPRESSION GÉNÉTIQUE
Gène (ADN) ARN messager protéine