Mardi 12 novembre 2024
- Présidence de Mme Christine Lavarde, présidente -
La réunion est ouverte à 15 h 30.
Audition de M. Sébastien Soriano, directeur général de l'IGN, sur l'utilisation de l'intelligence artificielle pour les territoires et l'environnement
Mme Christine Lavarde, présidente. - Je souhaite d'abord exprimer ma gratitude envers Sylvie Vermeillet pour son travail de réorganisation de l'agenda parlementaire, qui permet désormais aux délégations de disposer d'un créneau dédié en dehors du jeudi matin, notamment durant les semaines sénatoriales de contrôle.
J'indique ensuite que nous avons connu plusieurs changements au sein de notre délégation. Daniel Guéret a démissionné, son poste de vice-président n'étant pas compatible en pratique avec ses fonctions au sein de la délégation aux collectivités territoriales. Christian Bruyen le remplacera au poste de vice-président de notre délégation. Je profite de cette annonce pour signaler que le rapport qu'il nous a présenté lors de notre précédente réunion a trouvé un certain écho sur la toile, notamment chez les enseignants qui y voient une base de réflexion solide. Par ailleurs, Jean-Baptiste Olivier devient nouveau membre de notre délégation en remplacement de Daniel Guéret.
Nous auditionnons aujourd'hui le directeur général de l'IGN afin d'explorer la question des apports de l'intelligence artificielle aux politiques territoriales et à la mise en place des politiques environnementales. M. Soriano, qui a pris la direction de l'IGN il y a quatre ans, dirigeait précédemment à l'Autorité de régulation des communications électroniques, des postes et de la distribution de la presse (ARCEP) et n'est donc pas totalement étranger aux questions ayant trait au numérique, à l'innovation et aux évolutions technologiques. Il est accompagné de Matthieu Porte. Ils vont nous expliquer comment l'intelligence artificielle a été déployée au sein de l'IGN.
Lors de sa précédente intervention en juin 2022 devant notre délégation, M. Soriano avait évoqué trois grands défis de la transformation numérique et affirmé notamment que l'intelligence artificielle (IA) était un moyen de cartographier l'anthropocène. Il nous dira si, deux ans plus tard, ses propos d'alors restent d'actualité.
Deux questions me semblent en particulier importantes : comment l'IGN gère-t-il la politique de données ouvertes, qui prive les entités publiques de revenus au profit d'acteurs privés développant des outils à but lucratif ? Et comment l'IGN concilie-t-il sa mission de service public de collecte et de restitution des données avec les enjeux de souveraineté et de protection du territoire, sachant que la politique d'open data rend ces informations de cartographie accessibles à tous, y compris à d'éventuels agents malveillants ? Ces interrogations s'inscrivent dans notre réflexion prospective sur le déploiement de l'IA à l'IGN et sur les politiques de l'Institut.
M. Sébastien Soriano, directeur général de l'IGN. - Je commencerai par un propos introductif sur les enjeux de l'IA dans le domaine de la cartographie, en abordant notamment les deux questions que vous venez de soulever. Ensuite, mon collègue Matthieu Porte expliquera plus en détail le fonctionnement de cette IA, souvent perçue comme une mécanique froide.
C'est un plaisir d'être invité par votre délégation. En effet, l'IGN est très sensible aux questions de prospective, car il est lui-même traversé par des révolutions technologiques. Celles qui touchent à la cartographie sont aujourd'hui de trois ordres.
D'abord, l'informatique en nuage ou cloud computing, permet de manipuler des quantités de données beaucoup plus importantes grâce à des infrastructures partagées. À cet égard, l'IGN a construit la Géoplateforme, hébergeant un pétaoctet de données chez OVHcloud, le plus grand hébergeur français et européen dans le cloud.
Ensuite, l'IA facilite la combinaison des sources. Nous disposons aujourd'hui d'une multitude de sources de données - vues aériennes, satellites, radars, lidars - que nous pouvons combiner pour détecter et suivre des phénomènes complexes grâce à l'automatisation et à l'IA.
Enfin, nous disposons désormais de modélisations du territoire en trois dimensions, très précises, qui permettent de créer un jumeau numérique du territoire sur lequel nous pouvons simuler divers scénarios.
Ces trois transformations ont d'importantes implications pour le service public et l'attention de votre délégation sur ces questions est précieuse. L'IGN met ces nouvelles technologies au service du suivi des enjeux écologiques et agricoles. Le territoire change plus rapidement qu'auparavant, en lien avec le phénomène appelé anthropocène. L'institut est mobilisé par les pouvoirs publics pour cartographier divers aspects : les forêts, les parcelles agricoles, les trames de biodiversité, l'évolution du littoral, l'urbanisation ou encore l'artificialisation des sols. Nous sommes également missionnés par les ministères qui financent les opérations de relevés et de cartographies thématiques.
Nous évoluons dans un secteur numérique très ouvert et avons fait le choix de profiter de cette ouverture pour collaborer avec d'autres acteurs. La loi a imposé à l'IGN de rendre ses données totalement ouvertes au 1er janvier 2021. Cela a entraîné une perte de revenus qui n'a pas été entièrement compensée. Notre modèle économique repose, d'une part, sur une subvention pour charge de service public qui nous permet de couvrir notre activité dite socle, d'autre part, sur des financements obtenus des ministères pour les projets qu'ils nous confient. C'est un modèle assez vertueux qui permet, une fois les projets financés, que chacun bénéficie des données qui en sont issues. L'ouverture des données facilite grandement notre collaboration avec d'autres acteurs. Ainsi, nous collaborons régulièrement avec les services départementaux d'incendie et de secours (SDIS) qui, sur le terrain, peuvent repérer et nous signaler des erreurs de manière que nous puissions les corriger dans notre base, ce qui facilitera leurs futures interventions.
L'ouverture des données de l'IGN est un choix de société. Opter pour des données fermées réduirait nos capacités collaboratives et augmenterait les coûts de production. Il faut aussi considérer l'articulation européenne, avec la directive sur les jeux de données de haute valeur (high-value datasets) qui couvre la plupart des données que manipule l'IGN et impose leur ouverture au niveau européen.
En ce qui concerne la protection de la souveraineté, nous nous soumettons évidemment aux directives nationales. Pour autant, de nombreuses sources ouvertes existent déjà, notamment OpenStreetMap, le « Wikipédia de la carte », qui est un outil ouvert et collaboratif amélioré chaque jour par plus d'un million de contributrices et contributeurs.
L'accès aux cartes a toujours été un enjeu stratégique, mais, aujourd'hui, la quantité de données accessibles rend difficile leur restriction totale.
L'IA représente un investissement rentable. Par exemple, pour le suivi de l'artificialisation des sols, elle nous a permis de travailler trois fois plus vite pour un tiers du coût. Cependant, son déploiement nécessite un investissement initial important lié à la phase d'apprentissage de la machine, laquelle suppose de « nourrir » la machine d'une donnée parfaitement cartographiée. Dans le cas du suivi de l'artificialisation des sols, la phase d'initialisation a coûté près de 20 millions d'euros, tandis que les mises à jour triennales coûteront environ 5 millions d'euros.
L'utilisation de l'IA implique également des changements dans la gestion des ressources humaines. Nous avons besoin de moins de techniciens mais de plus d'ingénieurs formés aux dernières techniques de science des données. Cela nous a conduits à un plan de recrutement de 150 talents, dont 30 data scientists.
Enfin, il faut considérer l'aspect infrastructure pour effectuer ces calculs, en veillant à une utilisation efficace et raisonnée des ressources, conformément au concept de frugal computing.
M. Matthieu Porte, coordinateur des activités IA pour l'IGN. - Je vais m'efforcer de détailler concrètement le fonctionnement des systèmes d'IA utilisés à l'IGN pour la production de données géographiques.
Indépendamment de l'IA, le processus de production de données géographiques débute par leur collecte sur le terrain, notamment via des capteurs embarqués dans les trois avions de l'IGN qui survolent le territoire. Nous obtenons ainsi des photos aériennes ou des acquisitions 3D, comme avec le programme LiDAR HD, qui capturent l'état du territoire à un moment donné. Cela nous permet de disposer d'une première base de données comportant des référentiels issus de l'imagerie aérienne à haute résolution, avec une cartographie du territoire national avec une précision de 20 cm, actualisée tous les trois ans.
L'étape suivante consiste à analyser ces données pour en extraire des informations qui font sens. C'est ici qu'intervient l'IA, en particulier pour l'analyse des photos aériennes et des nuages de points 3D. Cette tâche requiert une expertise pointue, par exemple en photo-interprétation forestière pour identifier les essences d'arbres. Les modèles d'IA produisent des résultats comme des cartes d'occupation des sols, où chaque pixel d'un centimètre carré est classifié par catégorie : bâtiments, sols nus, routes, types de végétation. Pour les données 3D, l'IA attribue une classe à chaque point - bâtiments, végétation, sol - ce qui est utile pour diverses applications comme la modélisation du relief pour des simulations de crues.
Actuellement, l'IGN utilise une dizaine de systèmes d'IA dans ses productions, couvrant des domaines tels que la cartographie forestière et agricole. Ces systèmes fonctionnent par apprentissage supervisé. Nous créons des jeux de données d'entraînement, généralement sur environ 2 500 km² répartis sur le territoire national. Ces données sont initialement cartographiées manuellement, bien que le processus puisse être assisté par d'autres algorithmes. Par exemple, pour une zone urbaine d'environ 1 km², nous effectuons une saisie complète du contenu visible sur la photo aérienne. Cette zone est ensuite découpée en petites vignettes qui servent d'échantillons pour entraîner le modèle d'IA.
Notre approche opérationnelle s'appuie sur l'échelle utilisée par les photo-interprètes pour la saisie des données. Notre défi principal est de développer des modèles applicables à l'ensemble du territoire national, capables de fonctionner dans divers contextes - urbain, agricole, forestier - et de s'adapter à la variété des paysages et des conditions d'acquisition des images.
Nos modèles doivent être exposés à cette diversité pour éviter les erreurs lors de leur application. Nous sélectionnons donc des zones représentatives à travers le pays pour créer un échantillon réduit du territoire national, sur lequel nous réalisons des cartes manuelles servant à l'entraînement des modèles. Ce processus nous permet de passer de modèles entraînés sur quelques milliers de kilomètres carrés à des systèmes capables d'analyser tout le territoire. Ces systèmes amplifient l'expertise existante dans le travail de cartographie.
Un autre investissement crucial concerne les compétences. Nous avons besoin d'expertises en géographie, mais aussi en IA spécifique à la donnée géographique, ainsi que dans le traitement du langage et d'autres domaines du traitement d'images. Malgré la forte compétitivité du marché de l'expertise en IA, nous avons réussi à attirer des talents grâce au fait que nos missions ont un sens, grâce à notre qualité scientifique et technique, et grâce à notre politique d'ouverture. Nos efforts de recrutement et de formation interne nous ont permis de passer de 8 à 30 ingénieurs spécialisés en IA en deux ans.
Il est important de noter que la sortie brute d'un système d'IA n'est qu'une étape dans notre processus. Pour obtenir des données fiables d'appui aux politiques publiques, nous croisons ces informations avec d'autres bases de données, les nettoyons, les filtrons et effectuons un contrôle qualité reposant sur l'expertise humaine.
En comparaison d'autres projets de cartographie comme celui porté par Google ou le projet européen Corine Land Cover, notre approche OCS GE offre une finesse spatiale accrue, particulièrement utile pour des sujets comme l'artificialisation qui concernent des portions limitées du territoire.
Mme Christine Lavarde, présidente. - Je vous interromps pour relever la disparité temporelle des relevés entre les différents acteurs que vous venez de citer. Opérer un relevé tous les 6 ans, comme le fait le projet Corine Land Cover apparaît anachronique au regard de la fréquence des événements climatiques. Les délais de mise à jour vont-ils s'accélérer avec l'entraînement des modèles ? Quelles coopérations sont envisagées entre le projet européen et celui porté par l'IGN, par exemple ?
Mme Patricia Demas. - Des coopérations sont-elles à l'oeuvre avec le Centre national d'études spatiales (Cnes) dans l'utilisation des données satellitaires ? Y a-t-il un intérêt à combiner des données ponctuelles et localisées avec des données satellitaires plus fréquentes et étendues ?
M. Sébastien Soriano. - Nous pourrions en effet décider d'accélérer le rythme de mise à jour. Cela aurait néanmoins un coût. Le rythme de trois ans semble adapté, car l'évolution de l'artificialisation des sols est relativement faible à l'échelle nationale. Une fréquence annuelle rendrait les changements plus difficiles à détecter.
Notre outil peut néanmoins servir à d'autres fins. Par exemple, si la direction générale des finances publiques (DGFiP) souhaite développer des outils de détection des piscines, nous pourrions leur fournir ces informations annuellement. L'utilisation de l'outil dépend des besoins spécifiques de chaque service.
Concernant la collaboration européenne, nous sommes plutôt en avance sur nos voisins. Avec l'adoption récente du règlement européen sur la renaturation, nos collègues vont s'emparer de cette question. Nous avons déjà commencé à réfléchir à la façon dont nous pourrions proposer notre modèle à d'autres pays. Nous serions très heureux de pouvoir proposer notre technologie à d'autres pays européens.
Pour le spatial, nous entretenons un partenariat de longue date avec le Cnes. Nous sommes notamment impliqués dans la qualification des images du programme Pléiades Neo d'Airbus pour étendre sa constellation d'observations de la Terre à très haute résolution. L'utilisation combinée des sources aériennes et satellites est une de nos priorités à l'IGN. Il y a trois semaines, nous avons lancé avec le Cnes un comité des utilisateurs de l'imagerie qui sera une sorte de guichet unique compilant les besoins des administrations et des régions.
M. Matthieu Porte - Je vais poursuivre cette présentation en expliquant comment ce travail sur l'occupation des sols peut bénéficier à d'autres systèmes d'IA, à d'autres descriptions du territoire et à d'autres acteurs via le partage des jeux de données d'apprentissage. L'un des outils que nous mettons en oeuvre est l'organisation de défis scientifiques et techniques pour stimuler leur utilisation. Nous avons ouvert plus de 800 km² de données géographiques, dans le cadre d'une compétition scientifique et technique visant à proposer des modèles améliorant les performances sur la tâche d'analyse de l'occupation des sols tout en maîtrisant la consommation de ressources. En d'autres termes, nos jeux de données servent à stimuler la recherche et l'innovation puisqu'ils sont réutilisés dans la sphère académique, aussi bien dans le monde de la donnée géographique que dans celui de l'IA. Le jeu de données que nous avons construit pour le suivi de l'artificialisation des sols en France est l'un des trois principaux jeux de données pour l'IA au niveau mondial.
Ces données et modèles présentent un autre intérêt majeur : le transfert d'apprentissage. Il permet de partir de modèles existants pour les spécialiser sur de nouvelles tâches, réduisant ainsi les besoins en données et en calcul. Cela facilite l'accès à ces technologies et génère des gains économiques importants. Nous construisons sur ces bases pour des applications variées, comme la cartographie forestière, en intégrant de nouvelles sources d'information - lidar, imagerie satellite, radar. D'autres acteurs utilisent ces modèles à des fins diverses, comme pour le suivi de la nature en ville ou pour faire des cartographies de continuité écologique, démontrant la valeur de ces informations au-delà de la seule mesure de l'artificialisation.
Mme Christine Lavarde, présidente. - Je propose aux membres de notre délégation de poser leurs questions avant d'aborder le sujet du jumeau numérique.
M. Louis-Jean de Nicolaÿ. - Est-il possible de modéliser l'évolution d'une cartographie sur trois à six ans ?
M. Jean-Jacques Michau. - Vous nous avez présenté un état de l'existant. Quelles sont les évolutions attendues ?
M. François Bonneau. - Est-il possible de modéliser les inondations récentes en Espagne et celles survenues à plusieurs reprises en France ? De même, sera-t-il possible d'affiner la modélisation du recul du trait de côte dans le futur ?
M. Sébastien Soriano. - Vous anticipez sur la suite de notre présentation puisque c'est le défi du jumeau numérique. Vos interventions nous confortent dans l'idée que nous ne nous trompons pas de direction. Historiquement, la cartographie produisait des cartes sans destinataire spécifique, utilisables par tous. Aujourd'hui, nous avons fait le choix de nous spécialiser dans l'aide à la décision.
Le portail cartographique des énergies renouvelables illustre cette évolution. Dans le cadre de la loi Accélération, il permet aux maires de déclarer des zones avec des obligations réglementaires allégées pour l'installation des énergies nouvelles renouvelables (ENR). Cet outil superpose les informations sur le potentiel photovoltaïque, les obligations d'urbanisme et de protection du patrimoine, aidant ainsi à la décision publique.
Auparavant, la carte n'avait pas de destinataire précis. Désormais, l'IGN se spécialise dans l'aide à la décision publique. La prochaine étape sera de prévoir l'évolution de la modélisation. Notre jumeau numérique a été lancé avec deux grands partenaires : l'Institut national de recherche en sciences et technologies du numérique (Inria) et le Centre d'études et d'expertise sur les risques, l'environnement, la mobilité et l'aménagement (Cerema). Notre objectif est de construire « l'équipe de France » du jumeau numérique en travaillant avec des territoires et des entreprises qui proposent ce type de solutions. Pour le « zéro artificialisation nette » (ZAN), nous assistons les maires afin qu'ils puissent respecter les contraintes imposées par les pouvoirs publics. Outre les deux partenaires principaux précités, un consortium de partenaires privés y participe également. L'Inria nous aidera à modéliser l'avenir d'un territoire et à le représenter informatiquement. Le Cerema apportera son expertise en ingénierie dans divers domaines d'aménagement.
Notre prochaine étape consiste à modéliser les changements, objectif au coeur de la notion de jumeau numérique. Nous ne visons pas à créer un outil unique, mais à collaborer avec un écosystème d'acteurs locaux, notamment des collectivités territoriales, qui s'interrogent sur la cartographie, par exemple pour la prévision des îlots de chaleur, la propagation des virus, les risques d'inondation. Nous impliquerons également des entreprises proposant ce type de solutions.
Un exemple du type de simulations qu'il est possible d'obtenir en modélisant un écoulement d'eau est diffusé.
Nous collaborons étroitement avec la direction générale de la prévention des risques (DGPR) et les services de prévention des crues. Ils utilisent déjà nos modèles 3D, notamment ceux créés grâce au lidar, pour modéliser les bassins versants et simuler les écoulements. Ces données servent à élaborer les plans locaux de prévention des risques d'inondation (PPRI).
Un autre domaine où le jumeau numérique est très attendu est celui des forêts. Cet écosystème évolue lentement, à l'échelle de plusieurs décennies. Grâce au jumeau numérique, nous allons pouvoir choisir les types de coupes à réaliser et les essences à planter en simulant l'évolution de la température, les sécheresses, les risques d'incendie, la propagation des maladies ou la présence d'animaux. Ces simulations permettront aux exploitants forestiers, qu'ils soient publics comme l'Office national des forêts (ONF), communaux ou privés, de prendre des décisions éclairées. C'est un thème prioritaire pour nos travaux.
Concernant les enjeux d'aménagement et l'évolution du territoire à 3, 6 ou 9 ans, des outils sont en développement. Les données historiques sont déjà intégrées. Pour anticiper le futur, la direction générale de l'aménagement du logement et de la nature (DGALN) a lancé une start-up d'État nommée « Mon diagnostic artificialisation », qui propose des outils de simulation pour les territoires. C'est l'avenir de la cartographie : la carte du futur sera la simulation. Ce projet est technologiquement passionnant et vise à apporter des solutions concrètes aux décideurs, notamment aux élus locaux.
Nous avons lancé un appel à commun afin de recenser les acteurs intéressés par la construction de cette solution de jumeau numérique. Nous avons reçu plus de 100 réponses, incluant de grandes collectivités locales, des industriels et des opérateurs de réseau. Nous organisons actuellement des discussions pour répartir le travail sur les principaux thèmes évoqués.
Nous espérons le soutien financier de France 2030 et du secrétariat général pour l'investissement. Nous déposerons un dossier de financement d'ici la fin de l'année, en espérant qu'il aboutira malgré les contraintes budgétaires. Cet investissement vise à être utile à tous les acteurs qui pourront ensuite utiliser ces outils. Notre objectif est que le coût d'investissement initial soit pris en charge par l'État, permettant ainsi aux futurs utilisateurs d'accéder à l'outil à moindre coût.
Mme Christine Lavarde, présidente. - Dans mon département, un partenariat a été noué entre une collectivité et un acteur privé, Dassault Systèmes, avec l'objectif de mettre en place un jumeau numérique qui permettra de modéliser les évolutions des aménagements urbains afin de mieux faire face à l'augmentation des températures. Ce sujet fait-il également l'objet de vos travaux ?
Par ailleurs, un de nos collègues qui suit l'audition en ligne souhaite savoir si vous pouvez préciser, grâce à votre cartographie des haies, combien de kilomètres de haies disparaissent ou apparaissent chaque année.
M. Khalifé Khalifé. - Vous avez parlé de simulations dans le cadre de la prévention des risques. Avez-vous essayé d'utiliser les paramètres prédictifs pour anticiper les phénomènes climatiques ? Utilisez-vous les données météorologiques pour affiner les prédictions ?
Vous avez une échelle de précision de 20 cm. Sur le plan éthique, cela ne pose-t-il pas de problèmes en termes de protection de la vie privée des populations ?
Mme Sylvie Vermeillet. - Vous avez évoqué l'intérêt de divers acteurs, tant publics que privés, pour vos développements. Dans le domaine de la gestion des risques, les acteurs de l'assurance ont-ils déjà investi dans ces technologies ? Je m'interroge en effet sur la contrainte que ces solutions de modélisation pourraient faire peser sur les collectivités. En d'autres termes, y a-t-il un risque pour que le système assurantiel fasse pression sur une collectivité ou sur l'État pour décider de l'urgence de certaines mesures à prendre ?
Mme Christine Lavarde, présidente. - Je me suis beaucoup intéressée aux travaux menés en matière de prévention des risques. Une équipe de recherche japonaise n'a pas utilisé l'IA ou la modélisation numérique mais a construit deux rivières physiques : l'une équipée de moulins et de retenues, l'autre complètement désartificialisée pour permettre la continuité écologique. En simulant une arrivée massive d'eau, l'équipe a constaté que dans un cours d'eau naturel, l'eau se répand très rapidement. En revanche, dans le cours d'eau aménagé pour des activités économiques, le volume d'eau reste plus contenu, ralenti par les obstacles successifs.
Je m'interroge sur la capacité de vos outils à simuler l'impact des différentes politiques publiques. Examinez-vous notamment la question de l'aménagement des cours d'eau, remise en question après les récentes inondations dans le Pas-de-Calais et en Espagne ? Vos simulations permettent-elles d'évaluer les compromis nécessaires entre continuité écologique, protection des vies humaines et activités économiques ?
Mme Annick Jacquemet. - Vous nous avez présenté une modélisation d'écoulement d'eau représentant un pont ou un viaduc. Je souhaite savoir si vous pouvez déterminer la puissance maximale du flux d'eau que cette structure peut supporter avant de céder.
M. Sébastien Soriano. - En réponse à votre première question, notons que certaines collectivités locales sont pionnières dans l'adoption du jumeau numérique, ce qui est positif, car elles montrent la voie. La connaissance du territoire fait partie intégrante de l'administration moderne. Je ne commenterai pas le choix de faire appel à des acteurs privés ou publics. Nous constatons néanmoins, à travers nos échanges avec la communauté géomatique, que les solutions proposées par des acteurs très intégrés sont souvent difficilement appropriables. Les équipes peinent en effet à les intégrer à leurs systèmes d'information géographique existants. C'est la raison pour laquelle ces communautés de techniciens dans les territoires sont très demandeuses de solutions open source permettant une construction collective. Il appartiendra aux territoires qui se sont lancés de manière pionnière de décider s'ils souhaitent conserver leurs solutions propriétaires ou opter pour des solutions plus ouvertes. Il est également possible que ces entreprises fassent évoluer leur stratégie vers plus d'ouverture.
Concernant la fusion des données météorologiques, nous la réalisons actuellement de manière ponctuelle, notamment pour la forêt. Nous avons mené une étude prospective avec l'Institut forêt cellulose bois-construction ameublement (FCBA) sur la forêt en 2050, basée sur différents scénarios climatiques. Cependant, cette étude reste générale et ne fournit pas de données à l'échelle d'une parcelle.
Le principe du jumeau numérique est de permettre des croisements de données de manière générique, combinant différentes sources - météo, trafic routier, population, etc. - pour des analyses personnalisées. Cet outil reste à construire. Nous collaborerons étroitement avec Météo France, un institut proche de l'IGN, pour développer ces capacités.
Concernant les questions éthiques et l'échelle de précision que nous utilisons, la Commission nationale de l'informatique et des libertés (Cnil) considère que le respect de la vie privée est garanti par nos outils. Mais nous avons des débats récurrents avec les propriétaires forestiers qui contestent la mise à disposition de certaines données. Un avis récent de la Commission d'accès aux documents administratifs (Cada) dispose que les données attachées aux plans de gestion de la forêt, y compris privée, doivent être en open data. Toutefois, cette position est débattue entre juristes. Pour autant, la Cnil considère que la vue à 20 cm n'entrave pas le respect de la vie privée. Je précise que nous floutons toutes les zones signalées par les services régaliens, comme les sites militaires ou les prisons.
Concernant la cartographie des haies bocagères, nous avons effectué un premier relevé du linéaire de haies. Nous allons mettre en place un suivi régulier via l'observatoire de la haie, annoncé récemment par le gouvernement. Nous participons à ce projet piloté par le ministère de l'agriculture, en tant qu'opérateur. La cartographie complète des haies est encore à réaliser.
Concernant le système assurantiel, nos contacts avec ses acteurs sont assez limités. Les assureurs disposent de leurs propres systèmes de données et s'intéressent particulièrement aux prévisions météorologiques dans le domaine agricole. Nous pourrions néanmoins avoir un intérêt à travailler de manière plus articulée avec eux.
Quant à l'impact des prédictions pour les territoires, votre préoccupation est légitime. J'observe que la question du retrait du trait de côte ne relève désormais plus de la prévention des risques mais de l'aménagement du territoire. Cette approche pourrait s'appliquer à d'autres enjeux. Lorsque le phénomène n'est plus aléatoire mais certain, il ne s'agit plus d'un risque, ce qui peut modifier les chaînes de responsabilités et de financement. C'est un enjeu d'adaptation au changement climatique qui dépasse le cadre de l'information que nous fournissons. Concernant l'évolution du littoral, le Cerema a récemment publié des études fournissant des cartographies à l'horizon 2050.
Mme Sylvie Vermeillet. - Vous indiquez que les assureurs disposent de leurs propres outils d'évaluation, qui ont fait leurs preuves. Cependant, la question se pose : quelle méthode est la plus fiable ? Vos outils peuvent-ils fournir une expertise différente de celle des assureurs ?
M. Sébastien Soriano. - Nous observons des rapprochements. Les équipes chargées de l'innovation dans le secteur de l'assurance réutilisent des données ouvertes ou les exploitent comme jeux d'évaluation pour entraîner leurs modèles. L'écosystème assurantiel est composé de nombreuses start-up qui travaillent pour les acteurs de l'assurance avec des approches qui sont souvent similaires aux nôtres, notamment dans l'exploitation de l'imagerie aérienne et satellite. On constate une convergence significative dans les solutions développées.
Le jumeau numérique est un outil ouvert et accessible à tous, permettant à chaque acteur de se faire sa propre idée.
Concernant la solidité des ponts, l'IGN fournit les données, mais n'a pas d'expertise en termes de construction ou de prévention des inondations. Notre rôle se limite à l'apport d'informations, d'autres acteurs doivent prendre le relais pour l'analyse spécifique. Cependant, nous travaillons actuellement avec la DGPR pour constituer une base de données plus exhaustive sur la cartographie des ponts en France, grâce notamment au lidar.
Mme Annick Jacquemet. - Concernant l'enrichissement des données, je m'interroge sur l'interopérabilité des différents systèmes informatiques. Les logiciels sont-ils compatibles entre eux ? Est-il nécessaire de saisir manuellement les données dans chaque système ou existe-t-il une interface permettant leur transfert automatique ?
M. Sébastien Soriano. - Dans notre secteur, la compatibilité des formats de données est primordiale. Le Conseil national de l'information géolocalisée (CNIG), regroupant plus de 400 experts actifs dans la géomatique et d'autres domaines, définit des standards pour décrire uniformément les objets géographiques. Récemment, nous avons établi un standard pour le bâtiment, harmonisant les perspectives diverses de la DGFiP, de l'Institut national de la statistique et des études économiques (Insee) et de l'Agence de la transition écologique (Ademe). Cette approche nous permet d'avoir un langage commun basé sur la vérité géographique.
Il est normal que les logiciels présentent une certaine variété. À l'IGN, nous avons développé la Géoplateforme, une infrastructure nouvelle déployée en avril 2024. C'est une plateforme de données hébergée chez OVH, permettant aux acteurs publics de construire des systèmes de croisement, de contribution et de manipulation de l'information pour créer des cartes et des outils. Notre objectif est d'encourager les services déconcentrés de l'État à utiliser davantage les outils de la Géoplateforme de façon à travailler sur une base commune. Nous recherchons également une interopérabilité avec les principales solutions utilisées par les collectivités locales, permettant aux géomaticiens de dialoguer sur cette plateforme commune. Nous avons enfin l'ambition de construire le jumeau numérique en compatibilité avec la Géoplateforme.
M. Matthieu Porte. - L'un des enjeux majeurs dans la diffusion des données d'apprentissage consiste à s'adresser à des personnes extérieures au domaine de la donnée géographique. Il est crucial de rendre ces informations accessibles aux acteurs du monde de l'image, ainsi qu'aux communautés internationales, qui ne sont pas nécessairement familiers avec cet écosystème. Cela représente l'un des principaux défis dans la publication de jeux de données destinés à l'IA.
M. Khalifé Khalifé. - Dans une visée prospective, nous nous interrogeons sur divers aspects de l'urbanisme, notamment le positionnement des éoliennes et des antennes-relais. Les maires sont confrontés quotidiennement à des demandes d'autorisation, sachant que l'implantation des antennes-relais est souvent arbitraire. Quelle pourrait être la place d'un socle de plan local d'urbanisme (PLU) dans ce contexte ? Prévoyez-vous de fournir des recommandations aux collectivités pour leurs plans d'urbanisme ?
Une autre question, peut-être hors sujet, concerne les sous-sols et les canalisations. Nos communes sont souvent confrontées à des problèmes d'infrastructures souterraines. Qu'il s'agisse du gaz, de l'eau ou d'autres réseaux, les services techniques peinent parfois à localiser précisément leurs canalisations. Prévoyez-vous d'aborder ce sujet ?
M. Jean-Jacques Michau. - Parle-t-on de jumeau numérique au singulier ou au pluriel ? Comment intégrer les probabilités et les statistiques dans la prospective ?
M. Sébastien Soriano. - Concernant le PLU, le sujet déborde des compétences de l'IGN. Le ministère de l'écologie, via la DGALN, est pilote sur ces enjeux.
En ce qui concerne le jumeau numérique, nous avons identifié l'aménagement urbain comme un thème important. Nous travaillons avec le Cerema qui a développé des outils d'aide au diagnostic et aux stratégies d'aménagement.
Concernant les énergies renouvelables, nous avons lancé un portail cartographique, que la direction générale de l'énergie et du climat (DGEC) prévoit de développer pour mieux outiller les élus.
Pour les sous-sols, le projet Plan corps de rue simplifié (PCRS) est en cours de déploiement. Il vise à fournir une description précise des trottoirs d'ici 2026, sous la responsabilité des départements. Cette cartographie permettra une meilleure coordination des interventions sur les trottoirs et réduira les risques liés au réseau de gaz. Il s'agit d'un projet très décentralisé qui a pris un peu de retard.
Enfin, notre objectif est effectivement de développer un jumeau numérique dans tous les sens du terme. Cela signifie construire des briques technologiques que divers acteurs pourront ensuite proposer. Notre vocation n'est pas d'être dans une logique de service, car cela implique un accompagnement des utilisateurs, des évolutions et des adaptations spécifiques que nous ne sommes pas en mesure de fournir. Nous ne sommes pas une société de services informatiques. Notre souhait est qu'une pluralité d'acteurs économiques s'empare de ces outils pour les proposer aux utilisateurs finaux. Nous parlons bien de jumeaux numériques au pluriel, dans le sens où les prédictions fournies comporteront des intervalles de confiance et devront reposer sur des hypothèses transparentes quant aux choix effectués.
Mme Catherine Dumas. - Comment évaluez-vous les intervalles de confiance dans les prévisions ? Comment les collectivités territoriales sont-elles préparées pour s'approprier ces nouveaux outils ? Quelles avancées seraient nécessaires pour qu'elles deviennent des opérateurs ou des utilisateurs confirmés ? Comment pourrions-nous faire évoluer ces outils en synergie et comment améliorer leur connaissance et leur application pratique ?
M. Sébastien Soriano. - Vous posez des questions pour lesquelles je n'ai pas toutes les réponses. Les collectivités locales disposent de communautés techniques très actives. L'AITF, par exemple, propose formation continue et partage d'expériences. L'Afigéo qui regroupe tous les acteurs de l'information géographique, organise annuellement les Géo Data Days, un événement riche en débats. La communauté OpenStreetMap anime également de nombreuses discussions. L'État, via l'Agence nationale de la cohésion des territoires (ANCT), a initié une dynamique autour du numérique en commun, créant de multiples espaces d'échange. Il existe donc de nombreuses opportunités pour les techniciens du numérique et de l'information géographique de se rencontrer et de développer leurs compétences. Le Centre national de la fonction publique territoriale (CNFPT) offre également diverses formations. Je suis confiant quant à l'évolution de cette communauté dynamique. Les acteurs des territoires sont généralement plus avancés que ceux de l'État sur ces sujets.
Nous progresserons ensemble, même si des disparités existent entre les collectivités, notamment entre une grande métropole et un département rural en termes de capacités techniques. L'IGN propose de collaborer avec tous ces acteurs, offrant un filet de sécurité grâce à des solutions construites et facilement réutilisables par les entreprises et les collectivités.
Concernant les intervalles de confiance et l'interdépendance entre les écosystèmes, il est prématuré de répondre. Je note ces points comme des sujets d'attention auxquels nous devrons répondre ultérieurement.
Mme Sylvie Vermeillet. - Où en est-on par rapport aux autres pays ?
M. Sébastien Soriano. - La situation est très variable selon les pays européens. L'Allemagne, à la suite des graves inondations survenues il y a deux ans, a lancé un projet de jumeaux numériques de son territoire en utilisant des technologies Lidar HD similaires à celles de l'IGN. Nous collaborons étroitement avec le BKG, l'agence fédérale allemande qui pilote ce projet. Nous entretenons également des liens solides avec Swiss Topo, l'agence suisse qui réalise des relevés 3D depuis longtemps et dont nous nous sommes inspirés.
En Europe, on observe une grande diversité d'organisations. Certaines agences combinent les fonctions de cadastre et d'institut géographique, alors qu'en France ces deux entités sont distinctes. Dans d'autres pays comme l'Italie, ces instituts ont une vocation militaire.
Il n'existe pas de modèle uniforme à l'échelle européenne. Les acteurs du spatial développent des jumeaux numériques à grande échelle, adaptés à l'étude de phénomènes macroscopiques comme le niveau des mers ou l'effet de serre. L'Agence européenne pour l'environnement pourrait s'équiper d'outils similaires, mais à une échelle différente de la nôtre. Il faut distinguer l'analyse de l'évolution des océans de la faisabilité d'installation d'une éolienne dans une rue.
Mme Christine Lavarde, présidente. - Si l'on aborde la question épineuse des ressources humaines, nos différents rapports ont mis en évidence un manque de personnel qualifié lié notamment aux écarts de rémunération entre secteur public et secteur privé. L'IGN est-il confronté à ces difficultés en termes de recrutement ?
M. Sébastien Soriano. - J'ai mis l'accent sur la sécurisation des recrutements dès mon arrivée, conscient que sans les talents nécessaires pour relever les défis technologiques, nous serions dans l'impasse. Nous avons établi un plan de recrutement et de formation sur trois ans visant 150 talents dans divers domaines : technologies, animation de communautés, gestion de projets. Avant l'échéance, nous avons déjà recruté et formé 156 personnes.
Concernant la data science, malgré mes doutes initiaux, nous avons atteint notre objectif de recruter 30 data scientists. Nous nous fondons sur la grille de rémunération de la fonction publique DGSP et Dinum, qui offre plus de flexibilité pour les contractuels. L'IGN bénéficie d'un avantage, à savoir une masse critique de sujets qui attire les talents.
Nous avons également pris des mesures dans le cadre de notre école d'ingénieurs, l'ENSG. Nous avons modernisé les programmes en intégrant davantage de numérique et de science des données. De plus, nous avons augmenté la proportion de fonctionnaires formés. Alors qu'auparavant nous accueillions environ dix ingénieurs fonctionnaires par an ; en septembre 2025, nous en accueillerons 22, engagés pour huit ans dans la fonction publique.
Cette augmentation des promotions de fonctionnaires nous assure un accès pérenne aux talents, tout en nous permettant de contrôler les programmes de formation. Ainsi, nous disposons d'une capacité technologique à moyen terme pour répondre aux exigences. Je peux affirmer aujourd'hui que cet aspect RH, crucial pour notre trajectoire, est sécurisé.
M. Khalifé Khalifé. - Est-ce que vous produisez des données payantes ?
M. Sébastien Soriano. - Le modèle envisagé pour le jumeau numérique est encore en phase de consolidation. Il s'inspire de celui mis en place pour la Géoplateforme, une infrastructure ouverte permettant à tout acteur public d'accéder aux données. L'État a entièrement financé la construction de cette infrastructure, pour un coût d'environ 20 millions d'euros, via le budget de l'IGN et le fonds de transformation de l'action publique. Nous considérons cela comme faisant partie de notre mission.
Concernant les coûts de fonctionnement, nous cherchons à établir un équilibre. Une partie est prise en charge par nous-mêmes, car nous utilisons l'infrastructure pour le géoportail. L'autre partie serait supportée par les utilisateurs intensifs de l'infrastructure, notamment les administrations. Par exemple, la DGEC pourrait être amenée à contribuer financièrement pour l'utilisation du portail cartographique des énergies renouvelables qu'elle a commandé. Cependant, l'accès resterait gratuit pour l'utilisateur final, comme les maires consultant ces données.
Nous envisageons d'appliquer un modèle similaire au jumeau numérique. L'objectif est de proposer un coût d'utilisation raisonnable, l'investissement initial, qui représente la partie la plus risquée et coûteuse, ayant déjà été financé.
M. Khalifé Khalifé. - Pensez-vous que des acteurs privés pourraient vous commander des missions ?
M. Sébastien Soriano. - Nous sommes un établissement public administratif. À ce titre, nous sommes tenus par le principe de spécialité. Notre mission est strictement définie par décret, nous mandatant pour travailler prioritairement et principalement pour les acteurs publics. Élargir notre champ d'action nous placerait en concurrence avec les fournisseurs privés du secteur, ce qui n'est pas notre objectif. Nous privilégions une logique de complémentarité, où nous agissons comme l'institut public de référence tandis que les entreprises privées commercialisent leurs propres services. Notre mission étant encadrée par la loi, toute modification relève de votre compétence en tant que législateur.
Mme Christine Lavarde, présidente. - Je vous remercie pour cette présentation. J'ai parcouru l'Atlas que vous venez de publier. C'est une très bonne synthèse des enjeux que vous avez exposés. Il est accessible en ligne.
Cette audition a fait l'objet d'une captation vidéo, qui est disponible en ligne sur le site du Sénat.
La réunion est close à 17 h 10.