C. ALBERT, UN SOUVERAIN LIBRE ET OUVERT

Cette précipitation est d'autant moins compréhensible que la Dinum avait commencé à travailler, en parallèle, sur un projet bien plus ambitieux, le chatbot Albert, présenté comme un outil d'IA générative « souverain, libre et ouvert, créé par et pour des agents publics », et destiné cette fois à améliorer les relations directes avec les usagers.

Initialement prévu pour le début de l'année, Albert devrait être déployé mi-2024 au sein du réseau France services, auprès des conseillers volontaires, afin d'aider ceux-ci à apporter des réponses fiables et pertinentes aux questions qui leur sont posées par les usagers, en temps réel. Il est pour cela réentraîné sur des données spécifiques (fine-tuning), principalement les 43 000 fiches de questions-réponses du site de « Services publics + », ainsi que 40 000 questions générées spécifiquement pour l'entraînement à partir des fiches élaborées par la direction de l'information légale et administrative (DILA) pour le site service-public.fr.

· Un modèle de base open source : initialement le modèle Llama 2 de Meta, puis finalement Mistral 7B, le plus petit modèle de Mistral AI, suite à une réorientation du projet.

· Un fine-tuning (réentraînement) sur des données spécifiques (fiches DILA, etc.).

· Un hébergement local sur les serveurs de l'État (et non sur un cloud privé).

En soi, le réseau France services est un excellent cas d'usage : s'il est possible d'effectuer de nombreuses démarches administratives courantes dans ses quelque 2 600 points d'accueil, les agents ne disposent évidemment pas d'une compétence sur l'ensemble des sujets. Un chatbot d'IA générative disposant d'une compétence transversale et capable d'adapter ses réponses et d'apporter des précisions pas à pas, au fur et à mesure de la discussion avec l'usager, semble être un outil idéal au service des agents - et un moyen pour le service public de gagner en accessibilité et en proximité.

Toutefois, là encore, il est conçu comme un simple « complément » à l'existant : il n'a pas vocation à se substituer aux agents, il ne modifie pas en profondeur la nature du service rendu ni son organisation, et n'en crée pas de nouveau. Pour le dire plus simplement : il n'est pas question qu'un usager puisse, depuis chez lui, s'adresser directement à Albert pour obtenir des conseils personnalisés et des explications détaillées, et encore moins pour faire les choses à sa place - soit précisément la rupture technologique introduite par les assistants IA comme ChatGPT.

Certes, en l'état actuel, la technologie n'est ni suffisamment mature (en raison du risque d'hallucination notamment, cf. infra), ni suffisamment maîtrisée par la Dinum pour envisager une utilisation directe du chatbot par les usagers : le modèle du « co-pilote », où l'agent public reste l'intermédiaire, est donc préférable à ce stade.

Une autre interrogation, plus fondamentale, porte sur la pertinence des choix technologiques : au nom de la « souveraineté », il a été décidé de privilégier un modèle open source, français de surcroît, mais ancien, peu performant (7,3 milliards de paramètres) et nécessitant une étape de fine-tuning complexe et coûteuse pour l'entraîner sur des données spécifiques, alors que les modèles plus gros et sans fine-tuning, par exemple GPT-4 (1,7 milliard de milliards de paramètres) ou même le plus récent Mistral Large, offrent des performances incomparablement supérieures et peuvent être utilisés directement.

Pour traiter des données sensibles, la question du choix entre un entre petit modèle « souverain » avec fine-tuning et un grand modèle « généraliste » peut se poser, mais pour des tâches simples sur des données publiques et accessibles à tous (les fiches de la DILA), cette position de principe en faveur de « la souveraineté à tout prix » pourrait être contreproductive. ChatGPT donne déjà des réponses satisfaisantes à la plupart des questions générales sur le service public français, et les prochaines versions du modèle devraient demain faire encore mieux.

Partager cette page