Marielle Chrisment (Etalab) : « ouvrir les données pour des cas d’usage à impact doit être naturel »
Par Bertrand Lemaire | Le | Gouvernance
Marielle Chrisment, directrice d’Etalab au sein de la DINUM, explique ici les enjeux de ce département et les défis qu’il doit affronter. L’État peut et doit gagner en efficacité, au service de tous les citoyens et agents, en multipliant les cas d’usage à impact basés sur les données, ce qui repose sur leur ouverture et leur circulation.
Pouvez-vous nous présenter Etalab ?
Depuis sa création, l’objectif d’Etalab a toujours été de faciliter et promouvoir l’ouverture de la donnée et les usages à impact. Il n’y a eu aucun changement à ce sujet. Un cas d’usage « à impact » est un usage qui « impacte » la vie concrète quotidienne des citoyens et des agents.
Ce qui est nouveau, c’est la création au sein d’Etalab d’un datalab qui travaille sur des produits innovants, par exemple l’IA générative dédiée aux agents publics, Albert.
Au départ, nous nous occupions du portail public de l’open data, data.gouv.fr. Nous continuons de travailler au quotidien sur le sujet mais le portail lui-même est aujourd’hui géré par le département « opérateur de produits interministériels » (OPI) de la DINUM, qui est également en charge d’autres plateformes telle qu’api.gouv.fr.
Etalab assure aussi un travail de fédération et d’animation de la communauté des data scientists de l’État (y compris les chefs de datalab dans les ministères). De même, nous veillons au bon fonctionnement du réseau des AMDAC (administrateurs ministériels des données, des algorithmes et des codes sources), qui sont les responsables des données des ministères, la Directrice interministérielle du numérique, Stéphanie Schaer, étant l’administratrice générale des données des algorithmes et des codes sources (AGD), c’est à dire la « CDO » de l’État.
Nous sommes actuellement dans une phase de consolidation et de renforcement de ces communautés. Nous travaillons notamment à compléter le réseau des AMDAC par un réseau plus fin de relais au niveau des directions, des services déconcentrés, voire des opérateurs.
Quelles sont vos relations avec les AMDAC et les autres professionnels de la donnée ?
Nous avons un rôle d’animation et d’accompagnement. Nous rencontrons régulièrement les AMDAC pour rester à l’écoute de leurs besoins et propositions. Nous accompagnons les cas d’usage à impact avec un appui adapté aux besoins de chacun.
Notre accompagnement peut très bien se limiter à répondre à quelques questions juridiques. Mais celui-ci peut aussi être plus complet, et porter sur le volet technique en collaboration avec les autres départements de la DINUM. Il n’existe pas de limite fixée a priori au soutien apporté par Etalab aux ministères et opérateurs de l’État. Il n’existe pas non plus de cloisonnement entre les services de la DINUM pour apporter ce soutien.
Par exemple, nous travaillons actuellement sur le service public des données de référence (SPDR) qui vise à mettre à disposition les jeux de données qui constituent une référence commune pour nommer ou identifier des produits, des services, des territoires ou des personnes. La qualité des données du SPDR a trois critères : la complétude, la fraîcheur et la diffusion. Tous les réutilisateurs doivent utiliser le même langage et savoir exactement de quoi ils parlent. L’un de ces services publics de données de référence est la Base Adresses Nationale (BAN), diffusée par l’IGN (Institut national de l’information géographique et forestière). Grâce à cette base par exemple tous les services d’urgence peuvent intervenir au bon endroit au plus vite.
Pour chaque donnée de référence, l’administration-source reste responsable de celle-ci. Chaque chef de projet gère leur diffusion mais on peut aussi l’aider à ce niveau-là, y compris en nous appuyant sur le responsable de la sécurité des systèmes d’information (RSSI) de la DINUM si besoin et sur les préconisations de l’ANSSI (Agence nationale de la sécurité des systèmes d’information), etc. Il existe deux principaux cas de figure : soit l’administration-source nous contacte pour une demande d’appui, soit nous avons des suggestions et nous la contactons, à chaque fois en lien avec le réseau des AMDAC.
Au-delà de l’accompagnement, nous cherchons à repérer les bonnes pratiques, les bonnes idées, pour les accélérer et améliorer les usages. L’idée reste toujours de faciliter et accélérer la circulation de la donnée en cassant les silos. De la même façon, nous cherchons à développer l’envie de réaliser des cas d’usage à impact exploitant les données en nous appuyant sur la promotion des projets réussis.
Un exemple d’un tel projet est lié aux bourses dites « proactives » du ministère de l’Éducation nationale, de la Jeunesse, des Sports et des Jeux olympiques et paralympiques. Pour éviter le non-recours par des élèves éligibles qui pourraient y prétendre et faciliter la perception des bourses, en évitant de demander une liste de justificatifs (scolarité, revenus, etc.), elles seront attribuées de manière proactive à partir la rentrée 2024. Bien que le rôle des AMDAC demeure encore partiellement méconnu, il gagne progressivement en visibilité. Il faut faire savoir au sein de chaque administration l’existence de ce point de contact pour tout sujet ayant trait à la donnée. Le réseau des AMDAC date de 2021 et il faut toujours un certain temps pour que ce genre de nouveauté rentre pleinement dans la connaissance collective.
Retrouvez Marielle Chrisment à la Nuit de la Data
Marielle Chrisment fait partie du jury des Trophées de la Nuit de la Data. Elle a donc assisté aux présentations des candidats ayant déposé un dossier le 18 janvier 2024 et vous la retrouverez à la cérémonie de la Nuit de la Data et de l’IA le 5 février 2024.
Toutes informations sur la Nuit de la Data et de l’IA et inscription.
Mettez-vous à disposition des porteurs de projets des moyens techniques ou financiers ?
Tout dépend du sujet. S’il ne s’agit que d’une ouverture de données ou d’API, nous expliquons comment les référencer sur data.gouv.fr ou api.gouv.fr.
S’il s’agit d’un projet d’IA, par exemple, on peut héberger le projet si nécessaire. Notre fourniture d’outils est très souple, définie au cas par cas. Le cas d’usage gouverne le type d’accompagnement, qui peut aussi être financier. Le guichet de financement « Exploitation et valorisation de la donnée » sur fonds de transformation de l’action publique (FTAP) peut ainsi servir à financer de tels projets, dans la limite de 50 % du budget total du projet et pour un montant maximum de 500 000 euros. En 2023, cela nous a permis de co-financer une vingtaine de projets avec des budgets allant de 100 000 à 1 million d’euros. Beaucoup d’entre eux visent à faciliter la transition écologique.
Pour nous, il s’agit d’une part d’accélérer les projets, d’autre part d’optimiser l’utilisation de l’argent public. Lorsque l’on travaille sur la qualité du service public, chaque projet peut rapidement prendre une grande ampleur, ayant une incidence directe sur le quotidien de millions d’administrés. À chaque projet, nous examinons ce qui est « réplicable » ailleurs - c’est-à-dire dans d’autres ministères ou opérateurs de l’État - en plus de vérifier que le projet se déroule correctement et correspond aux objectifs fixés par guichet.
Est-ce que Etalab mène lui-même des projets ?
Bien sûr ! C’est le cas notamment de l’IA générative « Albert ». Une expérimentation d’usage d’Albert est d’ailleurs en cours au sein des France Services. Les administrations sont en demande d’outils comme par exemple pour résumer ou synthétiser des documents. Albert et ses déclinaisons de produits fait l’objet d’une réelle attente des agents publics, toujours au bénéfice des administrés.
Lorsque nous travaillons nous-mêmes sur un projet, nous vérifions d’abord ce qui a été fait dans les autres labs de l’administration. Si une initiative fonctionne bien quelque part, il vaut mieux la diffuser plutôt que de chercher à la refabriquer ! Et c’est autant valable sur le projet lui-même que sur les infrastructures, la sécurité, les jeux de données d’entraînement, etc.
Pourquoi avez-vous créé votre propre datalab ?
Nos projets sont par nature interministériels. Lorsqu’un laboratoire d’un ministère développe un projet, c’est en principe pour son propre portefeuille sectoriel. Toutefois, nous travaillons bien entendu avec tous les laboratoires data et IA pour faire profiter tous les ministères des avancées réalisées ici ou là. On peut chercher à réutiliser un projet en totalité ou bien une ou plusieurs briques le constituant (algorithme, sécurité, infrastructures, etc.). L’idée est d’avoir des produits développés pour un usage utile au plus grand nombre.
Comme toutes les administrations ne peuvent pas, à chaque projet, se contacter systématiquement entre elles, c’est aussi notre rôle de casser les silos, de faire circuler l’information.
Quels sont les grands projets en cours au sein d’Etalab ?
D’abord, nous en avons déjà parlé, notre produit Albert. Nous accompagnons aussi des projets sur les bourses proactives ou la systémisation de l’attribution des pensions de réversion. Ce sujet est d’une grande complexité concernant les données à mobiliser car il peut exister une multitude de cas particuliers.
À chaque fois, pour chaque projet, il faut savoir débloquer les difficultés, surtout sur pour les cas complexes et aller chercher les données nécessaires au bon endroit.
Etalab est-il concerné par les difficultés liées à la guerre des talents ?
Les talents de la donnée sont particulièrement en tension. Nous travaillons donc bien sûr avec Cornelia Findeisen, cheffe de la filière RH du numérique de l’État sur ce sujet.
Ceux qui nous rejoignent sont d’abord motivés par l’intérêt général, par le fait de mener des projets qui impactent la vie quotidienne de millions de personnes. C’est particulièrement le sens de l’intérêt général qui séduit les talents qui viennent chez nous. Bien entendu, nous veillons aussi à proposer des conditions de travail intéressantes comme par exemple trois jours de télétravail par semaine, ainsi qu’une véritable cohésion d’équipe. Etalab mais également la DINUM sont des marques employeurs reconnues sur ces points.
Bien entendu, nous utilisons nos communautés pour recruter. Par exemple, les Entrepreneurs d’Intérêt Général (EIG) qui sont passés par le programme peuvent nous rejoindre ou promouvoir nos offres dans leur réseau.
Pour terminer, quels sont vos défis actuels ?
D’abord, nous devons faire connaître les magnifiques projets qui réussissent et promouvoir les personnes qui sont derrière ces succès. Il est toujours important de valoriser les projets, les personnes et les impacts concrets.
Dans le même ordre d’idée, nous voulons que les usages se multiplient en prenant exemple sur les réussites qui sont déjà actées. Nous devons faire en sorte qu’ouvrir les données pour multiplier des cas d’usage à impact soit naturel.
Bien entendu, en lien avec le Campus du Numérique, nous devons faire en sorte que soient formés les talents data de demain.
Enfin, nous devons nous impliquer dans davantage de projets d’usage de l’intelligence artificielle, en lien bien sûr avec les AMDAC et aussi la communauté d’innovateurs sur l’IA, « AllIAnce ».
Podcast - Etalab, la mutualisation de l’intelligence
Marielle Chrisment, directrice d’Etalab au sein de la DINUM (Direction interministérielle du numérique), revient ici sur les missions de ce département qui a bien évolué depuis douze ans. Aujourd’hui, il s’appuie sur des communautés professionnelles dans les différentes administrations pour faciliter l’échange et le partage de données afin de multiplier les gains concrets pour les citoyens à moindre coût. De plus, il mène, au sein de son datalab, des projets interministériels qui ont vocation à servir au plus grand nombre. C’est notamment le cas de l’intelligence artificielle générative Albert.