2. Une science fondée sur l'identification et la recombinaison des gènes

Chez tous les êtres vivants quels qu'ils soient, l'information génétique est contenue dans les gènes, constitués d'ADN, présents dans chaque cellule de l'organisme. Ces gènes " s'expriment " en permettant la synthèse des protéines constitutives des tissus vivants.

a) Un aperçu du fonctionnement du vivant6( * )

Qu'est-ce qu'un gène ?

Le gène peut être défini comme " un segment d'ADN qui code une protéine et l'ensemble des séquences régulatrices, constituant ainsi une unité d'information génétique " 7( * ) .

Plus précisément, les gènes sont constitués de brins d'acides nucléiques, eux-mêmes composés d'une succession de nucléotides, unis les uns aux autres par des liaisons " phosphodiesters ". Chaque nucléotide se compose notamment de " bases " qui lui confèrent une identité.

Ces bases sont au nombre de quatre, dénommées par les lettres A, T, G, C, pour l'ADN, et A, U, G, C pour l'ARN. C'est l'ordre dans lequel se trouvent ces bases qui constitue l'information codée des gènes.

" On peut donc comparer l'ADN à une bande magnétique : la chaîne de phosphate-ribose [sous-jacente] étant l'équivalent du support plastique et l'ordre des bases l'équivalent de la position des petits grains magnétisés collés sur la bande plastique " 8( * ) .

L'ADN est le plus souvent sous forme de double brin, s'appariant grâce à la " complémentarité des bases ", A avec T et G avec C.

Une caractéristique remarquable des gènes, qui mérite d'être soulignée d'emblée, est l'universalité du code génétique : en effet, quelles que soient les espèces, les gènes sont toujours formés de cet assemblage de nucléotides (A,T,G,C), chaque gène étant défini, rappelons-le, par l'ordre d'enchaînement de ces nucléotides.

Il n'y a donc pas de différence fondamentale entre la nature des gènes des différentes espèces . Seuls le nombre et la complexité des gènes différent : le patrimoine génétique d'une bactérie est 100 fois plus complexe que celui d'un virus, celui d'un mammifère 100.000 fois plus complexe que celui d'un virus 9( * ) . Ce patrimoine génétique est appelé le génome.

Le génome 10( * )

Au sens strict, le génome est l'ensemble des gènes d'un organisme, rassemblés sous forme de chromosomes : les gènes sont localisés dans le noyau des cellules chez les organismes " eucaryotes " (levures, plantes, animaux) et dans l'espace intracellulaire pour les cellules qui n'ont pas de noyau, les " procaryotes " (bactéries).

Chez les organismes supérieurs à reproduction sexuée, chaque chromosome (et donc chaque gène) est présent en double exemplaire : l'un qui provient de la mère, l'autre du père. Les gènes homologues sont appelés " allèles ".

La taille des génomes varie -on l'a vu- selon les organismes. Celui de certains virus bactériens ne contient que trois gènes, contrastant avec celui, bien plus important, des mammifères.

" Les chaînes d'ADN renfermées dans les chromosomes de chacune de nos cellules font plus d'un mètre de long . Si l'on devait écrire la formule chimique du génome humain (contenu donc dans chaque cellule) sous sa forme la plus condensée (à l'aide des lettres ATGC), il faudrait de nombreux volumes qui tiendraient sur une étagère de 50 mètres de long " 11( * ) .

Le génome humain contient en effet environ 100.000 gènes, soit 3 milliards de bases (présents dans chaque cellule). Seulement 20.000 gènes sont toutefois exprimés.

Le code génétique

Le code génétique est le système de correspondance entre les séquences de nucléotides de l'ADN et les protéines synthétisées, composées d'acides aminés. On sait en effet depuis une dizaine d'années environ qu'à trois bases successives correspondent un acide aminé, comme indiqué dans le tableau suivant :

TABLEAU DE CODE GÉNÉTIQUE :
CORRESPONDANCE ENTRE BASES ET ACIDES AMINÉS



Base ou nucléotide initial

Base ou nucléotide central

Base ou nucléotide final

 

U

C

A

G

 

U

Phe

Phe

Leu

Leu

Ser

Ser

Ser

Ser

Tyr

Tyr

non-sens

non-sens

Cys

Cys

non-sens

Tryp

U

C

A

G

C

Leu

Leu

Leu

Leu

Pro

Pro

Pro

Pro

His

His

GluN

GluN

Arg

Arg

Arg

Arg

U

C

A

G

A

Ileu

Ileu

Ilet

Met

Thr

Thr

Thr

Thr

AspN

AspN

Lys

Lys

Ser

Ser

Arg

Arg

U

C

A

G

G

Val

Val

Val

Val

Ala

Ala

Ala

Ala

Asp

Asp

Glu

Glu

Glt

Gly

Gly

Gly

U

C

A

G

Tableau tiré de : " génétique moléculaire ", Encyclopédia Universalis

Ala : alanine

Arg : arginine

Asp : acide aspartique

AspN : asparagine

Cys : cystéine

Glu : acide glutamique

CluN : glutamine

Gly : glycine

His : histidine

Ileu : isoleucine

Leu : leucine

Lys : lysine

Met : méthionine

Phe : phénylalanine

Pro : proline

Ser : sérine

Thr : thréonine

Tryp : tryptophane

Tyr : tyrosine

Val : valine

Un acide aminé est codé par trois bases prises dans l'ordre suivant, de gauche à droite : la base initiale à gauche, la base centrale dans l'une des quatre colonnes du centre, et la base terminale à droite ; ainsi on voit que UUU correspond à la phénylalanine (Phe) ; CUU à leucine (Leu), etc... Les trois triplets qualifiés de " non-sens " servent de signaux de ponctuation.

Le code génétique est universel 12( * ) , c'est-à-dire qu'il est le même dans toutes les espèces. En conséquence, un gène d'une espèce introduit dans le génome d'une autre espèce codera pour les mêmes acides aminés c'est-à-dire pour la même protéine que dans l'espèce de départ (toutefois sous certaines conditions, et notamment l'adaptation du gène " promoteur " (cf. ci-après).

Autour de ces " messages génétiques codés " que constituent les associations de bases " signifiantes ", existent, sur le brin d'ADN, des régions régulatrices, chargées de régler l'expression des gènes considérés. On trouvera ainsi, en amont d'une région codante, un gène " promoteur ", et en aval, un gène " terminateur ", indiquant respectivement le début et la fin du message génétique.

L'expression génétique

Un fragment d'ADN est une information inerte tant que le message qu'il contient n'a pas été " exprimé ", c'est-à-dire décodé par une cellule.

L'expression génétique est " l'ensemble des mécanismes qui permet à un gène de délivrer son message " 13( * ) et de devenir opérationnel, c'est-à-dire de déclencher la production de la protéine qu'il code.

Le mécanisme très complexe qui est à l'oeuvre peut être résumé de la façon suivante : lorsqu'un gène doit s'exprimer, il est préalablement copié , sous la forme d'une molécule d'acide ribonucléique messager, ou ARNm, qui contient lui-même un message codé, décrypté dans le cytoplasme des cellules, c'est-à-dire hors du noyau cellulaire, par un système de décodage constitué de ribosomes et d'ARN de transfert. Ce procédé donne naissance à la protéine , qui exécute concrètement le programme contenu dans le gène.

De cette façon, l'information génétique contenue dans l'ADN n'est pas altérée.

Ce mécanisme peut être ainsi schématisé :

L'EXPRESSION GÉNÉTIQUE

Gène (ADN) ARN messager protéine

Les thèmes associés à ce dossier

Page mise à jour le

Partager cette page