B. UNE CULTURE DE LA DONNÉE
1. Les modèles de management des données
La prise de conscience de l'importance de la data tend à s'imposer dans le monde des collectivités territoriales depuis quelques années. Deux événements marquants ont d'ailleurs joué un rôle d'accélérateur dans ce sens. D'une part, la crise sanitaire de la Covid-19 a brutalement mis en évidence l'importance de disposer de données publiques fiables pour répondre à une situation d'urgence15(*). D'autre part, l'envolée des prix de l'énergie à la suite du conflit en Ukraine16(*) a montré l'intérêt de récupérer les données de consommation en électricité pour chercher à réaliser des économies et des projections budgétaires soutenables. À cette époque, une commune a d'ailleurs été particulièrement en pointe et sous les feux de l'actualité : Saint-Sulpice-la-Forêt. En installant une soixantaine de capteurs sur l'ensemble de ses bâtiments publics, elle a en effet dégagé près de 45 000 euros d'économies en six ans.
Pour collecter puis utiliser la data dans le cadre d'un projet IA, les collectivités territoriales doivent néanmoins s'organiser. Pour celles en ayant la capacité du point de vue budgétaire et en termes de ressources humaines, il s'agit de développer en interne sa propre expertise.
Le rapport précité de l'Observatoire Data Publica fournit, à cet égard, un tableau d'ensemble instructif. Il relève que « l'implication de la direction générale des services (DGS) dans la gestion des données n'est pas marginale : elle est leader, ou fait preuve d'une implication forte, dans 38 % des cas. Le constat est encore plus clair si l'on considère les résultats pondérés [ie selon la taille des collectivités territoriales]. À l'inverse, il est très rare que la DGS ne fasse montre d'aucune implication dans ces sujets. La comparaison avec l'an dernier fait clairement apparaître une plus grande implication des DGS, notamment dans les communes et les établissements publics de coopération intercommunale (EPCI) ».
Les directions informatiques sont également « impliquées comme leader ou de manière forte dans 60 % des collectivités. Paradoxalement, c'est surtout dans les régions et les métropoles que les DSI sont les moins impliquées - sans doute parce que, dans ces structures, il peut y avoir des services en charge des données de manière autonome ». La montée en charge des directions informatiques est particulièrement notable dans les départements.
Les services pilotant les systèmes d'information géographique (SIG) « sont le dernier service jouant assez souvent un rôle leader en matière de gestion des données. C'est assez logique, puisque dans de nombreuses collectivités ces services existent depuis longtemps et disposent de compétences précieuses pour gérer le patrimoine de données de la collectivité ».
Par contre, les services des archives exercent rarement un rôle moteur, même si « leur implication apparaît "forte" dans un nombre non négligeable de cas (18 % des répondants), en particulier dans de "grosses collectivités" (départements, EPCI, métropoles) ». L'implication du service Communication, tout comme des services techniques, est généralement plus ponctuelle, mais caractéristique des communes de moins de 100 000 habitants.
À partir de là, quatre modèles d'organisation peuvent être identifiés dans les collectivités territoriales cherchant à gérer leurs données.
Le premier modèle s'ordonne autour de la création d'un poste d'administrateur général des données, Chief Data Officer. Il concerne prioritairement les « grandes » collectivités, tout particulièrement les métropoles, mais également les départements et les régions. La métropole de Lyon a d'ailleurs été précurseure dans cette voie. Dans son rapport en 2023, l'Observatoire Data Publica observait que « des nominations de Chief Data Officer sont annoncées pour les douze prochains mois, notamment dans les régions, les métropoles et les EPCI », ce qui témoigne de l'intérêt de ce mode d'organisation pour les collectivités disposant d'une taille critique suffisante. Il est d'ailleurs retenu par 24 % des répondants au questionnaire de l'Observatoire.
Plus décentralisée, la deuxième approche se structure autour d'un réseau de référents data. Ce réseau peut d'ailleurs se rattacher à la nomination d'un Chief Data Officer. S'agissant de cette organisation en réseau, l'Observatoire Data Publica note que « la taille de la collectivité est ici très prédictive : l'intégralité des régions répondantes est dotée d'un réseau de référents ou en mettra un en place dans les douze prochains mois, tout comme la plupart des métropoles. Dans les autres collectivités, si la mise en place d'un réseau de correspondants est prévue dans environ un quart des cas, une majorité ne prévoit pas de s'en doter à court terme ».
Le Comité data représente une troisième voie d'organisation, il renvoie à l'instauration de ce qui s'apparente à un « comité stratégique ». Placé par exemple sous la responsabilité de la DGS, il se réunit régulièrement (tous les deux mois à Dijon, par exemple), parfois en présence d'élus. Il a pour mission de coordonner la gestion des données à l'échelle de la collectivité. L'Observatoire Data Publica précise que le Comité data « pourrait se développer pour devenir une modalité relativement répandue de management de la donnée : 19 % des répondants annoncent avoir prévu d'en mettre un en place dans les douze prochains mois. Cela concerne notamment les métropoles et les régions, qui prévoient quasiment toutes d'en être équipées ».
Enfin, la dernière formule, correspond à la création d'une Direction de la donnée. Il s'agit bien évidemment d'une structure plus lourde, exigeant le déploiement de moyens humains et budgétaires plus conséquents. Dès lors, elle ne peut être retenue que dans des collectivités d'une taille suffisante. L'Observatoire Data Publica observe néanmoins que « les métropoles et régions sont équipées dans environ un quart des cas et annoncent envisager de le faire, dans l'année, dans un autre quart » et qu'« une proportion non négligeable de communes annoncent envisager d'en créer une ». Ce choix d'une direction de la donnée a notamment été celui de communauté d'agglomération de la région Nazairienne et de l'Estuaire (CARENE), pionnière dans cette voie.
Une fois ces options théoriques passées en revue, la question se pose en pratique de savoir combien de collectivités territoriales ont déjà opté pour l'une ou l'autre de ces formules. D'après Jacques Priol, il y aurait déjà une quarantaine de collectivités engagées sur une organisation structurée du traitement des données. Même si ce chiffre est dans l'absolu plutôt conséquent au regard du caractère récent de l'émergence de l'IA, force est de remarquer que ce ratio est extrêmement faible ramené à l'ensemble des collectivités sur le territoire.
Pour autant, toutes les collectivités territoriales n'ont pas vocation à se lancer dans une « course à l'armement » pour traiter la donnée. Le critère discriminant essentiel réside bien évidemment dans la taille de la collectivité, qui conditionne ses capacités budgétaires, ses ressources humaines et le volume de données la concernant. Il ressort des auditions conduites par vos rapporteures que le point de bascule entre les collectivités se situe vraisemblablement aux alentours de 30 000 à 40 000 habitants : une fois passé ce seuil, un emploi à temps plein est potentiellement mobilisé sur la collecte, le traitement et l'utilisation de la data.
Proposition n° 3 : dans les collectivités ayant la taille critique suffisante, mettre en place un management des données par un administrateur général des données (Chief Data Officer), un réseau de référents data, un Comité data ou une Direction de la donnée. Délai : 3 ans Acteur(s) : collectivités territoriales |
2. La gouvernance de la data
La gouvernance de la data renvoie aux règles de mise à disposition des données et aux cas d'usage de celles-ci. La mise en place d'une telle gouvernance assure un cadre sécurisant pour toutes les parties prenantes au sujet : les agents de la collectivité territoriale, les élus, ainsi que les partenaires / interlocuteurs publics et privés. En cela, elle représente une étape primordiale dans le processus de diffusion de l'IA, auquel elle offre un cadre de confiance. Selon une approche extensive, cette notion de gouvernance comprend également une dimension éthique, à laquelle vos rapporteures consacreront des développements spécifiques infra (cf. Partie II. E. 2.) eu égard à son importance.
Selon l'Observatoire Data Publica, la formalisation d'une gouvernance de la donnée est en nette progression au sein des collectivités locales. Un peu plus d'un tiers d'entre elles (38 % des répondants) indiquent avoir d'ores et déjà défini des règles en la matière, soit une progression significative de 10 points entre 2022 et 2023. La dynamique est en cours puisqu'un tiers des collectivités ayant participé à la consultation (34 %) annonce son intention de se doter d'un arsenal de règles à un horizon de douze mois. L'Observatoire précise que « les métropoles et les régions (mais aussi les structures territoriales autres que les collectivités) sont les plus avancées, toutes les strates et tailles de collectivités s'intéressent activement à la gouvernance des données ».
Les formes retenues pour matérialiser cette gouvernance varient selon la taille des collectivités concernées et les publics visés. L'étude réalisée par l'Observatoire Data Publica permet d'ailleurs de distinguer les grandes tendances. Lorsqu'elles se saisissent du sujet, les collectivités de taille modeste privilégient une politique de gestion interne des données. Cette politique sert de référence aux agents et aux services en interne, elle permet de lever certains points de blocages (en dissipant des ambiguïtés, en arbitrant entre différentes options, en sécurisant la prise d'initiative...). Dans les collectivités de taille plus conséquente, elle est complétée par une gouvernance des données dans le cadre des relations avec les partenaires extérieurs. Cette gouvernance se signale alors notamment au travers de clauses contractuelles relatives aux données.
Ces clauses contractuelles méritent une attention particulière dans la mesure où elles ont notamment vocation à préserver les collectivités d'un « pillage » de leurs données. Une question se pose en effet inévitablement en matière d'IA : une fois les données rendues accessibles au partenaire / prestataire privé, comment la collectivité peut-elle s'assurer qu'elles ne seront pas détournées de leur usage initial ? Pour lever ce doute, la collectivité a tout intérêt à verrouiller au mieux sa relation contractuelle avec son prestataire.
Parmi les interlocuteurs des collectivités territoriales figure au premier rang l'État. La place de celui-ci est essentielle en matière de production, de circulation, de partage et d'utilisation des données. Par exemple, les administrations d'État contribuent au service public de mise à disposition des données de référence, tel qu'introduit par la loi n° 2016-1321 du 7 octobre 2016 pour une République numérique. À cet égard, dans son rapport17(*), la mission « Data et territoires » souligne la nécessité de clarifier le rôle et les responsabilités respectives de l'État et des collectivités territoriales. La mission recommande notamment la création de Comités territoriaux de la donnée.
Les Comités territoriaux de la donnée : une instance de coordination au niveau territorial Dans la conception de la mission « Data et territoires », les Comités territoriaux auraient plusieurs missions. « Tout d'abord, ils devraient définir des feuilles de route favorisant le partage des données à des fins d'intérêt général. Ces feuilles de route identifieraient les cas d'usages prioritaires ainsi que les jeux de données à ouvrir prioritairement, en lien avec les cas d'usage identifiés. « Elles auraient aussi pour objectif de répartir les rôles entre les acteurs et contiendraient un volet financier. « Ces comités assureraient également l'articulation entre les plateformes de mise à disposition des données, voire soutiendraient la création d'espaces communs de données (...). « Ces comités pourraient être créés à l'échelle régionale, conformément au code général des collectivités territoriales qui dans son article L. 4211-1 prévoit que chaque région a pour mission " la coordination, au moyen d'une plateforme de services numériques qu'elle anime, de l'acquisition et de la mise à jour des données géographiques de référence nécessaires à la description détaillée de son territoire ainsi qu'à l'observation et à l'évaluation de ses politiques territoriales, données dont elle favorise l'accès et la réutilisation ". De plus, c'est au niveau régional que sont bâties de nombreuses stratégies (aménagement, développement durable et égalité des territoires, économie et innovation) et que se dessinent les futures conférences des parties (" COP régionales "). Le niveau régional est donc naturel pour l'animation territoriale de la donnée. « Toutefois, chacun des usages de données territoriales peut nécessiter de définir un " territoire pertinent " qui peut être aussi bien une intercommunalité s'agissant de thématique de déchets ou du traitement des eaux usées comme de leur réutilisation, un département s'il s'agit d'un usage principalement lié à des questions de politique sociale, qu'un bassin versant s'agissant de l'usage de l'eau ». |
Si vos rapporteures sont sensibles à l'impératif de ne pas multiplier à l'excès les instances au niveau territorial, elles estiment toutefois que l'absence de structure dédiée à la coordination délocalisée de la donnée pourrait rapidement nuire à l'efficacité des politiques publiques. Elles voient dans ces Comités territoriaux de la donnée un lieu non seulement de travail, mais aussi de dialogue, propice à lever d'inutiles blocages entre les administrations et les collectivités territoriales. Par ailleurs, ces Comités pourraient favoriser les échanges et les retours d'expérience, facteurs de gains de temps et d'économies potentiellement considérables.
Proposition n° 4 : expérimenter des Comités territoriaux de la donnée pour faciliter le partage de données à des fins d'intérêt général et favoriser les échanges d'expérience. Délai : 1 an Acteur(s) : ministère de l'Intérieur (direction du management de l'administration territoriale et de l'encadrement supérieur - DMATES), collectivités territoriales |
* 15 Cf. Sénat, rapport n° 199 (2020-2021) de Catherine Deroche, Bernard Jomier et Sylvie Vermeillet, au nom de la commission d'enquête sur l'évaluation des politiques publiques face aux pandémies, « Santé publique : pour un nouveau départ - Leçons de l'épidémie de covid-19 », déposé le 8 décembre 2020.
* 16 Cf. Sénat, rapport d'information n° 135 (2023-2024) de Françoise Gatel, alors présidente de votre délégation, « Hausse du coût de l'énergie et inflation : difficultés conjoncturelles ou crise structurelle pour les collectivités territoriales ? », déposé le 20 novembre 2023.
* 17 Septembre 2023.