2.- LA BIOLOGIE DE SYNTHÈSE EST-ELLE UNE TECHNOLOGIE ?

La BS applique les principes et les méthodes de l'ingénierie et utilise d'autres technologies variées. En effet, jamais autant qu'aujourd'hui la présence des ingénieurs dans la BS n'a été aussi forte. La biologiste Pamela Silver, professeure à la Harvard Medical School, considère que la BS serait la technologie de ce siècle.

a) L'application des principes et des méthodes de l'ingénierie à la biologie

La BS a trouvé dans l'ingénierie le moyen de simplifier l'approche du vivant comme le montrent les analyses du professeur Sven Panke, du professeur Richard Kitney de l'Imperial College de Londres et d'une équipe de chercheurs de l'Université de Princeton.

1° L'analyse de Sven Panke

L'analyse de Sven Panke repose sur une comparaison entre la BS et les disciplines d'ingénierie, selon cinq domaines :

- la constitution d'un savoir étendu et utilisable,

- l'orthogonalité,

- la hiérarchie de l'abstraction,

- la normalisation,

- la séparation entre la conception et la fabrication.

La constitution d'un savoir étendu et utilisable : selon Sven Panke, la BS est en train de constituer un savoir de plus en plus étendu mais pas toujours utilisable, à la différence de certaines disciplines classiques de l'ingénierie telle que la mécanique. Sven Panke relève le fait que la connaissance sur le fonctionnement interne de la cellule est incomplète puisque, par exemple, 24 % des gènes de la bactérie Escherichia coli 28 ( * ) ne sont toujours pas caractérisés du point de vue de leur fonction.

Au terme de cette analyse comparée entre la BS et les disciplines d'ingénierie, Sven Panke considère que la BS doit opérer comme une « vraie » discipline d'ingénierie dans la perspective de pouvoir passer à une plus grande échelle. Les objectifs ainsi assignés à la BS doivent l'amener à affronter des défis de nature scientifique et technologique.

L'orthogonalité : toujours selon Sven Panke, du fait de la complexité du cytoplasme cellulaire, l'orthogonalité y est la plupart du temps absente, notamment chez les bactéries. Par exemple, l'introduction et l'expression d'un seul gène recombinant dans E. coli changent l'expression de centaines d'autres gènes. Cependant, des travaux montrent qu'il est possible d'introduire un acide aminé synthétique dans une protéine en évitant les multiples dichotomies successives normalement nécessaires pour y parvenir. Un premier défi scientifique sera celui de la mise en oeuvre du concept d'orthogonalité dans les systèmes biologiques. Comme on l'a vu, l'orthogonalité vise ainsi à rendre la machinerie cellulaire plus prédictible.

La hiérarchie de l'abstraction : la hiérarchie de l'abstraction est une terminologie importée de l'informatique qui intègre des portes logiques 29 ( * ) pour fabriquer des circuits. Sven Panke observe que la description des systèmes biologiques est d'habitude fortement focalisée sur le niveau moléculaire, les descriptions formalisées et fonctionnelles telles que les fournissent les circuits électriques dans les conditions rappelées précédemment étant rares.

La normalisation : la normalisation est un ensemble de contraintes devant permettre l'intégration de parties d'origines variées à la manière d'un jeu de meccano, utilisables et réutilisables par tous.

En revanche, selon Sven Panke, la BS n'est pas encore suffisamment pourvue de normes qui permettraient la fabrication de dispositifs s'intègrant avec une prédictibilité satisfaisante. Cette question de normalisation dans la BS revêt un intérêt pour l'Union européenne, qui a confié fin 2010 à un groupe d'experts le soin de formuler des propositions sur ces normes.

La séparation entre la conception et la fabrication : prenant l'exemple de la fabrication des automobiles, Sven Panke indique que leur conception relève d'un groupe de personnes différentes de celles qui procèdent à leur assemblage. Les unes et les autres ont des qualifications et des formations différentes. En revanche, en biologie, la construction d'un système biologique demeure en grande partie un projet de recherche où le chercheur, seul à la paillasse, doit rassembler toutes les compétences nécessaires.

Un autre défi concerne la façon dont la BS répondra à la problématique de l'évolution. En effet, parce que celle-ci constitue une source de changement dans les systèmes vivants, elle représentera toujours un obstacle lorsqu'il s'agira de préserver l'intégrité des dispositifs à long terme. L'assemblage des briques du vivant constitue donc un défi technologique qui devra être résolu afin de permettre de les combiner plus aisément.

Les principes exposés par les chercheurs rencontrés à Londres ne se sont pas inscrits dans des perspectives aussi vastes que celles de Sven Panke. Pour autant, dans leurs grandes lignes, leurs exposés reposent sur la même démarche, qui confirme bien que la BS applique les principes d'ingénierie.

2° L'analyse de Richard Kitney 30 ( * )

Richard Kitney estime que la BS se fonde sur les trois éléments suivants :

- les dispositifs, sur lesquels reposent les fonctions biologiques,

- les mécanismes, auxquels sont associées les briques,

- les systèmes, qui gèrent les tâches.

A chaque fois, les fonctions, les briques et les tâches doivent être reproductibles.

L'objectif est de déboucher sur la mise au point de commandes que l'on puisse introduire dans le vivant. Il serait ainsi possible de commander des systèmes naturels.

Près de 12 000 briques 31 ( * ) provenant du monde entier seraient déposées dans le registre du MIT (Registry of Standard Biological Parts) et accessibles en open source par internet. Or l'un des problèmes résulte du fait que peu d'entre elles sont caractérisées jusqu'à présent. C'est pourquoi l'objectif est de parvenir dans les deux années à venir à un inventaire complet et automatisé.

3° L'analyse des chercheurs de l'Université de Princeton

Pour ces chercheurs, l'objet de la BS est d'étendre ou de modifier le comportement du vivant et de le transformer en vue d'accomplir certaines fonctions. Dans cette perspective, ils recourent à une analogie très parlante, en établissant un parallèle entre la cellule et l'ordinateur, comme l'illustre le graphique ci-après.

Source : Ernesto Andrianatoandra et al., graphique 1, « Synthetic biology : New engineering rules for an emerging discipline », Molecular systems biology, 2006

Les gènes, les protéines, entre autres, sont à la cellule ce que les transistors, les condensateurs et les résistances sont à l'ordinateur. Il s'agit dans les deux cas d'éléments fondamentaux qui déterminent le fonctionnement du système et que les ingénieurs peuvent manipuler, remplacer, interchanger. Ces éléments essentiels constituent la base d'un système hiérarchisé conformément à la notion de hiérarchie de l'abstraction vue précédemment.

La hiérarchie cellulaire s'organise, selon les chercheurs de Princeton, depuis les molécules de bases ou briques (ADN, ARN, protéines, etc.), qui interagissent entre elles. Ces interactions biochimiques, qui constituent le second niveau de cette hiérarchie, participent elles-mêmes à des voies métaboliques. Celles-ci s'intègrent dans le troisième niveau constitué par les cellules, indépendantes, sous forme de culture ou structurées en tissus.

Dans ce contexte, la modification du vivant par les biologistes de synthèse est conçue au sommet de la hiérarchie mais mise en oeuvre en partant de la base ( bottom up ).

Pour autant, les chercheurs de Princeton insistent sur le fait que cette hiérarchie cellulaire est ancrée dans un environnement marqué par la complexité et l'incertitude.

C'est pourquoi, pour contourner la complexité et l'incertitude, les biologistes de synthèse voient l'organisation cellulaire en termes de dispositifs inclus dans des modules.

Selon les chercheurs de Princeton, un dispositif est une structure simple, prédictible et contrôlable, dérivée des systèmes naturels existants ou modifiée par les biologistes de synthèse. Parmi les exemples, on peut citer les ARN non codants utilisés pour activer ou inhiber l'expression de certains gènes.

Lorsque différents dispositifs ont des fonctions interconnectées, ils constituent alors un module pour accomplir des tâches complexes. Dans la cellule, les modules sont des chaînes de réactions spécifiques, telles que les voies métaboliques.

En résumé, si l'analogie avec l'informatique - préconisée par les chercheurs de Princeton mais qui fait l'objet de débats - est importante, celle-ci comporte toutefois des limites. Car si changer de programme ne signifie pas pour autant modifier l'ordinateur, dans la BS, le changement de génome entraîne de fait la modification de la cellule, comme l'a démontré l'expérience de Craig Venter, ainsi que nous le verrons plus loin.

b) La mise en oeuvre de technologies variées

La BS utilise principalement les technologies suivantes : la modélisation informatique, le séquençage de l'ADN, la synthèse chimique ou biologique de l'ADN et la microfluidique.

1° La modélisation informatique : de la paillasse à l'ordinateur

La modélisation est l'un des outils actuels de la BS. Elle consiste, sur support informatique, à élaborer des modèles à partir de données concernant des réactions biochimiques, à mettre en équation ces données puis à réaliser des simulations. Les modèles doivent ensuite être validés en comparant les résultats ainsi obtenus avec ceux des expériences 32 ( * ) . La BS va donc de l'éprouvette à l'ordinateur et vice versa.

Dans ce cadre, les biologistes de synthèse peuvent depuis une décennie s'appuyer sur un langage spécifique à la modélisation en biochimie, le langage SBML ( System biology markup language ). Parmi les autres instruments figure la conception assistée par ordinateur CAO ( computer-aided design tools ). Cette technologie rend possible la génétique combinatoire, c'est-à-dire l'association de gènes pour créer des génomes. La CAO contribue également au séquençage des génomes.

LE RECOURS A LA MODÉLISATION AU JAPON

1. Le projet E-Cell

Démarré en 1996 au sein du laboratoire du Pr Tomita de l'Université Keio par une poignée d'étudiants en biologie moléculaire, le E-Cell Project désignait au départ un programme informatique modélisant une cellule ne possédant qu'un nombre limité de gènes indispensables à sa survie. L'organisme de référence pour cette expérience était Mycoplasma Genitalium dont le génome est considéré comme l'un des plus courts du monde vivant (580 000 paires de bases) (en dehors des virus).

En 1997, le E-Cell Project évolue et permet de modéliser d'autres systèmes cellulaires plus complexes tels que des érythrocytes humains, des mitochondries et la souche bactérienne E. coli chemotaxis. L'expression de leurs gènes et la réplication sont également prises en compte dans cette nouvelle version du programme.

Grâce à la création de l'Institut des Biotechnologies Avancées de l'Université Keio en avril 2001, les scientifiques continuent d'optimiser la réalité de leurs modèles à l'aide des données protéomiques, métaboliques et génétiques des différents groupes de chercheurs et d'ingénieurs du service. Le code de ce programme est disponible en libre téléchargement sur le site internet officiel.

2. La Kyoto Encyclopedia of Genes and Genome (KEGG)

Depuis 1995, la Kyoto Encyclopedia of Genes and Genome (KEGG) est développée par le professeur Minoru Kanehisa dans le laboratoire Kanehisa de l'Université de Kyoto. Financée à l'époque par le Ministère de l'Éducation, de la culture, des sports, des sciences et de la technologie (MEXT) et créée par l'Université de Kyoto et de Tokyo en 1995, la Kyoto Encyclopedia of Genes and Genome est une des premières bases de données sur les systèmes vivants au Japon.

Durant les dix dernières années, l'Institute for Bioinformatics Research and Development (BIRD) dépendant de la Japan Science and Technology Agency (JST) a assuré le financement de cette base de données. Elle perdure aujourd'hui grâce à l'association « NPO Bioinformatics Japan » récoltant notamment les dons des utilisateurs.

KEGG est l'une des bases de données gratuites les plus consultées au monde et elle est régulièrement citée comme référence pour la pertinence et la précision de ses données.

3. Kitano's Symbiotic Project

Mené par les équipes des professeurs Hiroaki Kitano et John C. Doyle, le Kitano's Symbiotic Project a débuté en 1998 grâce au soutien financier de la Japan Science and Technology Agency (JST). L'essentiel de leurs travaux a concerné la standardisation des systèmes biologiques à l'aide de codes graphiques et de modélisation bio-informatique. De nombreux supports et outils ont été développés et restent disponibles en libre téléchargement sur le site officiel du projet :

• Le Systems Biology Mark-up Language (SBML) : un langage de modélisation des réseaux chimiques ;

• Le Systems Biology Workbench (SBW) : une plate-forme logicielle permettant le développement de nombreuses applications pour l'assemblage, l'ajout, la gestion et l'analyse de données ;

• Le Cell Designer : outils de représentation des systèmes et de leur biochimie grâce à des codes graphiques.

Le professeur Kitano a également proposé une définition du concept de « robustesse des systèmes vivants » en étudiant diverses caractéristiques des cellules telles que les fonctions relatives aux cycles génétiques, aux rythmes circadiens et aux signaux de transduction.

La seconde et ultime phase du projet a pris fin en 2008 et elle a donné lieu à de nombreuses collaborations, notamment avec des laboratoires américains.

Source : « La biologie de synthèse au Japon », note de Eric Perrot, service pour la science et la technologie de l'ambassade de France au Japon, 15 décembre 2011.

2° Le séquençage de l'ADN

Le séquençage consiste à définir l'ordre d'enchaînement des nucléotides dans un brin d'ADN. Définir cet ordre est nécessaire pour connaître le nombre et le type de gènes présents.

Les biologistes de synthèse séquencent les génomes pour obtenir des informations sur les modèles biologiques. Ces informations permettent la construction des briques et des dispositifs.

Le séquençage est également un moyen de vérifier que les génomes synthétisés correspondent bien aux objectifs prévus.

Les progrès ont été constants depuis l'invention du séquençage dans les années 1970. A cette époque, le séquençage de quelques centaines de nucléotides nécessitait une année. Quinze ans plus tard, on pouvait accomplir le même travail en un seul jour. Pendant longtemps, le séquençage était réalisé manuellement par une personne travaillant à la paillasse, qui lisait et interprétait les résultats. Aujourd'hui, le séquençage de millions de nucléotides est effectué de manière automatisée et dans un espace de temps très bref. Le séquençage d'un génome bactérien complet est une opération qui prend au total une semaine, dont quelques heures de fonctionnement du séquenceur automatique. Les résultats sont gérés par ordinateur, puis stockés dans les bases de données privées ou accessibles en ligne.

3° La synthèse artificielle de l'ADN

En 2002, le groupe de Wimmer de l'Université d'État de New York a reconstitué pour la première fois le génome du virus de la polio (7 741 paires de bases). Cette synthèse est également une première dans la mesure où elle a été réalisée à partir des séquences numérisées et non pas en s'inspirant d'un modèle biologique.

En 2003, l'Institut de Craig Venter a assemblé le génome du virus bactériophage 33 ( * ) Phi-174 (5 386 paires de bases) en seulement deux semaines.

En 2008, un collaborateur de Craig Venter, le Prix Nobel Hamilton Smith, a reconstruit le génome de la bactérie Mycoplasma genitalium (489 000 paires de bases).

Enfin, en 2010, Craig Venter a annoncé avoir synthétisé, toujours par voie chimique, un plus grand génome (1,08 million de paires de bases), celui de l'espèce Mycoplasma mycoides , et l'avoir transplanté chez M. genitalium dont il a pris le contrôle (l'ADN propre au Mycoplasma genitalium est détruit au cours de la multiplication de la cellule). Il a créé ainsi une souche bactérienne, s'auto-répliquant avec un ADN étranger construit synthétiquement. Cette expérience sera détaillée plus loin, dans le cadre des recherches sur le génome minimal.

4° La microfluidique

La microfluidique manipule, traite et contrôle des volumes de liquides extrêmement réduits, de l'ordre du microlitre (un millième de millilitre). Outil par excellence de la biologie moléculaire, et qui a contribué à son développement, la microfluidique présente plusieurs intérêts : économie, précision, fiabilité, rapidité, traitement d'un grand nombre d'échantillons par unité de temps et d'espace, gestion facilitée des déchets, sécurité accrue. De telles qualités sont d'autant plus cruciales pour la BS que celle-ci exige, sur le plan moléculaire, un niveau élevé d'efficacité, de rentabilité et de sécurité.

Un des cas où l'utilisation de la microfluidique est indispensable est la PCR ( Polymerase Chain Reaction ) 34 ( * ) . La PCR est basée sur un traitement thermique de l'ADN qui n'est possible que si les échantillons contenant l'ADN sont de l'ordre du microlitre. Ce volume peut être encore plus réduit. Ainsi, la presse a annoncé en mars 2010 qu'une équipe de chercheurs franco-américains (Harvard, MIT et Université de Strasbourg) avait mis au point un système miniaturisé traitant des volumes de l'ordre du picolitre (un millionième de microlitre). Plus petit qu'un iPod Nano, cet appareil analyse les réactions biologiques mille fois plus rapidement que par les méthodes classiques 35 ( * ) .

Cet appareil pourrait permettre à un producteur de biocarburant de contrôler les populations de micro-organismes ou de voies métaboliques pour trouver les produits chimiques ou les biocarburants les plus efficaces. C'est l'une des applications visées par la chimie verte.

5° Le remodelage

Le remodelage (refactoring) est un procédé informatique d'amélioration d'un logiciel sans affecter son fonctionnement. Il est utilisé en BS pour contourner la complexité de la cellule.

Comme on l'a dit précédemment, les biologistes de synthèse se trouvent confrontés au système cellulaire, ce qui pose un problème notamment lorsqu'ils souhaitent y introduire de l'ADN. Une solution pour y parvenir consiste à simplifier l'idée même de cellule en utilisant le terme de châssis 36 ( * ) , emprunté à la mécanique. Un certain nombre de bactéries ont été utilisées comme châssis, notamment Mycoplasma par Craig Venter.


* 28 E. coli est le modèle bactérien principal utilisé pour étudier le fonctionnement cellulaire.

* 29 En informatique, les portes logiques (ex : AND, OR) sont des instructions qui permettent de faire fonctionner un microprocesseur.

* 30 Professeur à l'Imperial College de Londres.

* 31 Andrew Torrance, « Synthesizing Law for Synthetic Biology », Minnesota Journal of Law, Science & Technology, 2010.

* 32 «Biologie systémique, standards et modèles», sous la direction de Magali Roux, Omniscience, 2007.

* 33 Un bactériophage est un virus spécifique des bactéries.

* 34 La PCR est une technique d'amplification de l'ADN.

* 35 http:/www.redorbit.com/news/technology/1823681/mariage_of_microfluidics_optics_could_advance_labonchip_devices/

* 36 Un châssis est un hôte cellulaire optimisé pour accueillir un objet biologique de synthèse (rapport de la SNRI, 2011).