2.- LA COMPLEXITÉ DU VIVANT : UN VERROU À LEVER POUR LA BIOLOGIE DE SYNTHÈSE

Ce qui caractérise le vivant, c'est sa complexité et, en particulier, l'importance de ses interactions avec son environnement, ainsi que la difficulté d'en prédire l'évolution. On voit bien les verrous que cela peut constituer pour des ingénieurs cherchant à construire de nouveaux organismes, qui plus est réplicables.

La complexité du vivant comme verrou de développement de la BS fait l'objet d'appréciations différentes selon les chercheurs rencontrés.

Si la grande majorité des biologistes de synthèse n'en contestent pas la réalité, ils estiment toutefois qu'elle n'est pas de nature à empêcher les progrès de leurs recherches.

a) Une évaluation contrastée de cette complexité

La complexité du vivant, comme verrou pour la BS, suscite des divergences de point de vue entre ingénieurs et biologistes et entre les biologistes eux-mêmes.

1° Les différends entre les ingénieurs et les biologistes

Drew Endy est certainement, parmi les ingénieurs, celui qui a contesté le plus vivement le recours à la notion de complexité du vivant comme facteur limitatif de l'évolution et de la pertinence même des recherches en BS. Ainsi en 2008 indiquait-il : « Les ingénieurs abominent la complexité. Je déteste les propriétés émergentes 103 ( * ) . J'aime la simplicité. Je ne veux pas que l'avion que je vais prendre demain révèle des propriétés émergentes durant son vol. » 104 ( * )

De même encore, lors du Colloque organisé par le Collège de France en 2009 intitulé : « De la chimie de synthèse à la BS » , soutient-il la possibilité d'une programmation (informatique) de l'ADN : « Nous ignorons comment la faire. Mais nous essayons. Nous nous lançons avec cette idée naïve que nous pourrions mettre en oeuvre une hiérarchie de l'abstraction 105 ( * ) nous permettant de gérer la complexité des systèmes biologiques. Le but serait qu'un opérateur puisse associer E. coli à une odeur 106 ( * ) , sans qu'il lui soit nécessaire de savoir que l'ADN est constitué de 4, 6 ou 8 paires de bases, ni de connaître les modalités selon lesquelles on peut le synthétiser. » 107 ( * )

Son objectif, constamment rappelé, de vouloir faciliter l'ingénierie de la biologie, dont le registre des bio-briques est l'instrument privilégié, fait néanmoins l'objet de critiques de la part des biologistes qui se confrontent à la complexité du vivant pour tenter de l'analyser et de la comprendre.

Précisément, si Luis Serano, chercheur espagnol, voit dans ce registre une grande idée, il estime toutefois que « nous ne devrions pas perdre de vue la décourageante complexité des systèmes vivants, en particulier celle des eucaryotes en comparaison de celle des procaryotes. Ainsi, à part la tâche ambitieuse de disposer d'un répertoire des briques pour les différents organismes, il n'existe aucune garantie qu'une brique qui fonctionne dans E . coli fonctionnera dans Bacillus subtilis . Nous ne pouvons jamais écarter la possibilité que de nouvelles propriétés émergentes et inattendues n'apparaissent en rassemblant les différentes briques qui ont été caractérisées de façon isolée ou dans un contexte différent. En outre, si nous souhaitons reconfigurer un véhicule automobile, nous connaissons déjà les spécifications de tous ses composants, et savons comment ils fonctionnent. Il est évident que ce n'est pas le cas des systèmes vivants. 108 ( * ) »

Dans le même esprit que Luis Serrano, Thomas Heams fait valoir que « la prédictibilité des résultats d'un programme génétique est constamment mise en difficulté par l'accrétion d'un champ de contraintes incroyablement complexes, variant dans le temps et dans l'espace, qui font de la notion même de programme (étymologiquement « écrit à l'avance ») une exception beaucoup plus qu'une règle. » 109 ( * )

En second lieu, évoquant la démarche de l'ingénieur et notamment l'idée qui a été défendue de pouvoir réparer une cellule comme un transistor, Thomas Heams conteste « la pertinence de déconstruire un génome en éléments de base sachant que ceux-ci n'ont jamais existé un par un, dans un catalogue, indépendamment les uns des autres ».

Les deux approches, celle de l'ingénieur et celle du biologiste, seraient-elles incompatibles ? Les entretiens que j'ai eus d'une part avec Ron Weiss et, d'autre part, avec Denis Pompon et Gilles Truan, chargé de recherche au CNRS, font apparaître une vision plus nuancée.

Ron Weiss a une démarche pragmatique et recherche, dans la complexité du vivant, les éléments simples qu'il analyse pour pouvoir les répliquer. Il prétend même pouvoir revenir ensuite à la complexité du vivant, grâce au modèle ainsi réalisé. Dans cet esprit, il avait fait déjà observer dans une étude consacrée à la deuxième vague de la BS 110 ( * ) : « Plutôt que de voir certains traits de la biologie comme étant problématiques, il pourrait être préférable d'en tirer profit. Il nous faut créer de nouveaux outils informatiques et de conception qui prennent en compte le caractère variable et incertain de la biologie ainsi que l'évolution et qui nous permettent de développer des systèmes plus fiables. »

Gilles Truan, pour sa part, a considéré que l'on avait eu trop tendance à opposer la démarche de l'ingénieur à celle des biologistes. Or, selon lui, il existe deux manières d'analyser les systèmes, en les déconstruisant et en construisant des morceaux. Par exemple, l'ingénierie des protéines essaye de trouver les protéines qui se fixent sur des surfaces métalliques, ce qui permet d'en comprendre le fonctionnement. En utilisant la démarche de l'ingénieur, on parvient ainsi à comprendre les problèmes de la biologie.

Quant à Denis Pompon, il a souligné que, comme le montre l'exemple de l'ingénierie des protéines cité par Gilles Truan, il était possible de comprendre la complexité en construisant. Il a également considéré qu'on pouvait parfois reconstruire des systèmes ayant les mêmes finalités que les systèmes naturels fonctionnant mieux que ces derniers, en utilisant des solutions différentes.

2° Les désaccords entre les biologistes

Les discussions ne sont pas moins vives entre les biologistes, comme en témoignent notamment les observations respectives de Michel Morange, du professeur Henri Atlan 111 ( * ) et d'Antoine Danchin 112 ( * ) .

Pour mieux souligner encore la diversité des facettes de la notion de complexité, Michel Morange précise qu' « une complexité de fonctionnement n'est d'ailleurs pas forcément le fruit d'une complexité de structure : des expériences très poussées ont montré récemment que des circuits de régulation génétiques simples, formés d'un petit nombre de composants, analogues à ceux que l'on trouve en grand nombre chez les êtres vivants, pouvaient avoir néanmoins des comportements complexes . »

En dernière analyse, Michel Morange considère que, « de manière simplifiée, on peut considérer qu'un système complexe est un système dont le comportement et les propriétés sont «plus» que celui et celles de ses constituants. Il y a un effet d'auto-organisation, avec des synergies entre les composants. Quelque chose émerge du fonctionnement intégré du système. Ce qu'il faut entendre par «plus» et «émerge» fait déjà l'objet de débats : plus peut signifier simplement que la connaissance des composants étant encore insuffisante, le fonctionnement du système apparaît aujourd'hui surprenant. »

L'analyse développée par Henri Atlan 113 ( * ) est assez complémentaire de celle de Michel Morange. Henri Atlan rappelle d'abord que, longtemps, la notion de complexité n'a été qu'intuitive, « étant un simple mot pour désigner nos difficultés à faire face à une situation donnée » .

Se référant aux travaux du mathématicien-physicien américain John von Neumann, Henri Atlan relève que ce dernier avait jugé le concept de complexité « vague, non scientifique et imparfait » . En outre, considérant qu'il ne suffisait pas d'utiliser le mot complexité pour rendre compte des phénomènes, John von Neumann a conclu qu'il désignait des phénomènes et des choses qui restent à expliquer. Henri Atlan estime que l'histoire récente de la biologie au cours de ces quinze dernières années a donné amplement raison à John von Neumann. C'est ainsi que, note Henri Atlan, « l'immunologiste cancérologue George Klein introduisait, il y a quelques années son séminaire sur les possibles voies de transmission de signaux cellulaires perturbées dans le cancer en avertissant que « les biologistes désormais doivent non seulement vivre avec la complexité, mais l'aimer » ».

Pour sa part, Henri Atlan souligne que, pour sortir du domaine des « énoncés vagues » , il avait lui-même commencé par distinguer la complexité de la complication. Celle-ci implique un grand nombre de données à traiter avec, cependant, une compréhension adéquate de la façon de les ordonner. « Au contraire, la complexité implique, en outre, une difficulté de compréhension, devant un système qui n'est qu'imparfaitement connu. »

Quant à Antoine Danchin, il fait observer que « complexité est l'un de ces mots-valises qui disent tout et son contraire. Ce mot signifie, en effet, des choses diamétralement opposées. Il signifie ou bien qu'un phénomène est d'un ordre très riche et très compliqué, parce qu'il est hautement organisé mais comporte de multiples éléments (d'un nombre généralement supposé dépasser l'entendement) ou tout au contraire, parce qu'il est très embrouillé, très désordonné. » Cela explique, à ses yeux, la pensée confuse qui entoure la biologie depuis bien longtemps, particulièrement en France.

b) Un défi réel qui n'empêche pas les progrès de la recherche
1° Un défi réel

En se référant à l'analyse d'Henri Atlan, on pourrait distinguer la complexité du système cellulaire et la complexité par le bruit.

Ø La complexité du système cellulaire

La complexité du système cellulaire illustre parfaitement les remarques rappelées précédemment de Michel Morange, Henri Atlan et Antoine Danchin. Quelques chiffres cités par Marie Montus, directrice de projets en Recherche et Développement au Généthon d'Evry, permettent de prendre la mesure de la complexité du système biologique de l'homme : environ 23 000 gènes, six transcrits par gène exprimé différemment selon les fonctions de la cellule, 60 000 milliards de cellules, des centaines de milliers d'interactions qui se déroulent dans chacune d'elles 114 ( * ) .

Or cette complexité est d'autant plus redoutable que, aujourd'hui encore, on peut relever une insuffisance des connaissances et des difficultés à comprendre de nombreux phénomènes, tant en ce qui concerne l'organisation et la structure du système cellulaire que son fonctionnement, ce que regrettent les biologistes de synthèse tels que Sven Panke.

Les composants de ce système ne sont pas tous connus. Les biologistes s'accordent sur le fait que le séquençage du génome humain est loin d'offrir un inventaire complet et définitif du contenu total en gènes (ou informations) du génome humain, en premier lieu, parce que l'identification des séquences codantes dans une séquence d'ADN d'eucaryote n'est pas évidente et, en second lieu, parce que des zones du génome réputées sans intérêt (ADN poubelle) codent cependant pour des ARN régulateurs.

Cette difficulté tient en plus à ce que, comme le relève Henri Atlan, la notion de gène possède des significations différentes. Elle peut être considérée comme un fragment d'ADN localisé dans le génome ou un ensemble d'exons 115 ( * ) , sans contiguïté spatiale, codant pour une protéine, ou encore une unité fonctionnelle corrélée à un caractère héréditaire dépendant de l'activité d'une ou de plusieurs protéines. Il en résulte les conséquences suivantes, indiquées par Henri Atlan dans son ouvrage « Le vivant postgénomique » :

1/ « La notion classique - un gène - une protéine - une fonction est l'exception plutôt que la règle. Non seulement, un gène code pour plusieurs protéines et une protéine est le produit de plusieurs séquences d'ADN, mais il arrive aussi qu'une seule et même protéine assure dans une cellule plusieurs fonctions totalement différentes, apparemment sans lien entre elles, suivant son emplacement et son microenvironnement. » 116 ( * ) Une des illustrations de cette complexité est fournie par la myopathie de Duchenne 117 ( * ) , pour laquelle on a répertorié plus de 4 700 mutations du gène codant la protéine affectée - la dystrophine - toutes n'aboutissant pas au même phénotype 118 ( * ) .

Deux maladies apparemment différentes peuvent résulter de mutations différentes dans un même gène, et inversement, une même maladie peut résulter de l'atteinte de gènes différents.

2/ « Le seul nombre de gènes découverts par l'analyse des génomes n'est pas une mesure de la complexité et de la diversité des mécanismes de traitement et d'expression de leur information par les réseaux de régulation intracellulaire 119 ( * ) . »

On comprend mieux, au vu de ces observations d'Henri Atlan, les incertitudes ayant entouré les estimations du nombre de gènes qui avaient été proposées à l'occasion du séquençage du génome humain. En effet, celles-ci étaient comprises entre 30 000 et plus de 200 000. On s'accorde actuellement sur un chiffre d'environ 23 000 gènes.

On constate les mêmes difficultés en ce qui concerne le génome des bactéries. Ainsi, un rapport du National Research Council 120 ( * ) rappelle-t-il qu'au moins un quart des gènes identifiés dans les génomes bactériens, qu'ils soient grands ou petits, pathogènes ou non, sont « hypothétiques » 121 ( * ) ou de fonction inconnue. Ce qui conduit le National Research Council à s'étonner de l'ampleur d'une telle lacune, compte tenu de la longue histoire de la recherche biochimique et génétique sur les micro-organismes.

L'analyse du fonctionnement du système cellulaire constitue une autre source de difficultés pour les biologistes et les ingénieurs. C'est bien, sur ce point, un constat d'impuissance qu'exprime la conclusion de l'étude précitée de Jing Liang 122 ( * ) .

Un tel constat est partagé par le rapport précité du National Research Council 123 ( * ) . Il relève que « la communauté scientifique n'a pas les connaissances suffisantes pour créer une nouvelle forme de vie qui soit viable, ni même un virus ». Le National Research Council considère, en effet, que « la conception de novo d'un génome viral infectieux à l'aide d'une séquence exige une prédiction exacte de la structure et de la fonction de la protéine, une conception des interactions entre les protéines et des machines protéiques, tout ceci devant produire une progéniture de virions 124 ( * ) , dans une cellule-hôte d'une taille considérablement plus complexe. Si nous ne pouvons pas prédire la structure et la fonction d'une protéine sur la base de séquences avec une quelconque exactitude, comment pouvons-nous concevoir et synthétiser de nouveaux virus qui se répliquent indépendamment de leur potentiel pathologique ? »

Bien que le National Research Council procède à cette analyse dans une perspective de bio-sûreté, il n'en confirme pas moins - sur le plan purement scientifique - les remarques du biologiste Gérald Karp, formulées dans son « Traité de biologie cellulaire et moléculaire » . Se référant aux études sur les interactions entre protéines effectuées à un niveau global - et non plus une à une - à l'aide du test Y2H(1) 125 ( * ) - Gérald Karp note que ce dernier est « fertile en incertitudes » .

Ø La complexité par le bruit

Pour ce qui est de la complexité par le bruit , qui est l'une des autres dimensions de la complexité soulignée par Henri Atlan -, elle est notamment illustrée par le caractère aléatoire de la plupart des processus biochimiques intracellulaires, y compris ceux qui contrôlent l'expression des gènes, comme l'ont montré des études récentes. C'est ainsi que la transcription des ADN en ARN et leur traduction en protéines semblent survenir par salves aléatoires, aussi bien pour ce qui concerne leur amplitude que le moment de leur survenue. Ceci a été observé notamment dans les cellules souches en cours de différenciation, ainsi que dans la maturation de populations de lymphocytes qui constitue aussi l'une des dernières étapes de la différenciation de ces cellules.

2° Le développement de la biologie de synthèse compatible avec la complexité du vivant

Que ce soit en biologie moléculaire ou en BS, la notion de complexité n'a pas eu pour effet de décourager les recherches. Bien au contraire, celles-ci contribuent à enrichir les connaissances scientifiques. Henri Atlan cite ainsi diverses découvertes, qui ont eu pour effet de remettre en cause certains modèles - par exemple celui de l'ordre du vivant « un gène - un enzyme - un caractère » . Ce modèle avait commencé à être battu en brèche à la suite de la découverte de la transcriptase inverse, processus dans lequel des séquences d'ARN, notamment de virus, peuvent être transcrites en direction opposée en nouvelles séquences d'ADN.

Mais comme le souligne Henri Atlan, le tableau a été rendu encore plus complexe par la découverte notamment de « petits ARN interférents » qui ajoutent un niveau supplémentaire dans les mécanismes de régulation de la traduction des ADN en protéines.

De même Gérald Karp observe-t-il que, quelles que soient leurs limitations, les tests Y2H à grande échelle sur les protéines précitées sont des points de départ d'études destinées à explorer une multitude d'interactions entre protéines jusqu'alors inconnues, qui toutes peuvent amener les chercheurs à un mécanisme biologique auparavant inconnu.

Il est au demeurant significatif qu'une récente étude 126 ( * ) cite le test Y2H comme l'un des outils pouvant être utilisé par les biologistes de synthèse pour améliorer la construction de leurs circuits de protéines synthétiques.

Mais au-delà, grâce à la construction de circuits génétiques simples, des chercheurs ont fait valoir que les biologistes de synthèse avaient pu progresser dans la programmation du comportement cellulaire et parvenir à une meilleure compréhension des principes gouvernant le comportement des réseaux naturels et déterminant leurs propriétés principales, telles que la robustesse 127 ( * ) .


* 103 L'émergence est une des caractéristiques des systèmes vivants, qui en passant d'une échelle à l'autre, celle des molécules à celles des cellules par exemple, fait apparaître des propriétés nouvelles et inattendues, qui empêchent de manipuler un système complexe de manière prévisible.

* 104 Interview sur le site d'Edge - The third Culture, 2008.

* 105 Comme on l'a vu précédemment, cette notion reflète l'assemblage de systèmes complexes non biologiques à partir de sous-systèmes orthogonaux.

* 106 Drew Endy mentionne précédemment dans l'article des expériences d'insertion d'ADN conduisant la bactérie E. coli à dégager une odeur de banane ou de menthe.

* 107 Drew Endy, «Building a New Biology», Comptes Rendus de l'Académie des Sciences, T.14, fascicule 4, 2011, p.427.

* 108 Luis Serrano, «Synthetic biology: promises and challenges, Molecular systems Biology», 18 décembre 2007.

* 109 Thomas Heams, «De quoi la biologie synthétique est-elle le nom ?, étude précitée.

* 110 Priscilla Purnick et Ron Weiss, «The second wave of synthetic Biology : from modules to systems», Nature, juin 2009.

* 111 Henri Atlan, professeur émérite de biophysique et directeur du Centre de recherche en biologie humaine à l'hôpital universitaire Hadessah de Jérusalem.

* 112 Antoine Danchin, professeur honoraire à la Faculté de médecine Li Ka Shing de l'Université de Hong Kong, président d'Amabiotics SAS.

* 113 Henri Atlan, « Le vivant post-génomique », éd. Odile Jacob, 2011.

* 114 Exposé de Marie Montus, lors du «Colloque sur la biologie intégrative : une nouvelle lecture des pathologie », Les Transversales santé, 18 septembre 2007.

* 115 Chez les eucaryotes, les exons sont les parties transcrites des gènes qui codent les protéines.

* 116 Henri Atlan,  «Le vivant post-génomique », ouvrage précité.

* 117 Cette maladie peut toucher tous les muscles, dont le muscle cardiaque. Elle se traduit par un déficit de la dystrophine, qui permet aux muscles de résister à l'effort.

* 118 Exposé de Marie Montus, directrice de projet en Recherche et Développement au Généthon, Evry, « Colloque sur la biologie intégrative : une nouvelle lecture des pathologies », Les Transversales santé, 18 septembre 2007.

* 119 Henri Atlan, op. cit . p. 57.

* 120 Le National Research Council est une institution qui rassemble les académies nationales des États-Unis. Le rapport ainsi visé est Sequence Based Classification of Select Agents , qui a été publié en 2010.

* 121 Les gènes hypothétiques sont de deux sortes : les uns existent dans différents organismes et les autres sont propres à des lignages spécifiques.

* 122 Jing Liang et al., « Synthetic biology: putting synthesis into biology».

* 123 National Research Council, Sequence Based Classification of Select Agents.

* 124 Un virion désigne une particule virale mûre libérée normalement dans le milieu après l'achèvement du cycle viral et capable d'infecter une nouvelle cellule.

* 125 Dans ce test appelé double hybride de levure ( yeast two hybrid ou Y2H), les gènes codant les deux protéines sont introduits dans la même cellule de levure. Si la levure répond positivement à une protéine rapporteuse, ce qui se traduit par une modification visible de la couleur de la cellule, cela signifie que les deux protéines ont interagi dans le noyau de la levure.

* 126 Raik Grüberg et Luis Serrano, «Strategies for protein synthetic biology », Nucleic Acids Research, 2010 vol. 38 n° 8.

* 127 Daniel Sayuat et al. , «Engineering and applications of genetic circuits», Molecular Biosystems, 2007.