Vincent Roberti (Unedic) : « l’IA étant partout, chacun doit adopter les bonnes pratiques »
Par Bertrand Lemaire | Le | Gouvernance
L’Unédic est une association paritaire qui gère au quotidien l’Assurance chômage. Pour cela elle exploite fortement la data pour remplir ses missions. Vincent Roberti, directeur des services numériques et de la stratégie de la donnée de l’Unedic, revient sur sa stratégie.
Pouvez-vous nous rappeler ce qu’est l’Unedic ?
L’Unedic est une association paritaire de droit privé exerçant une délégation de service public. Nous sommes environ 110 collaborateurs et six directions : juridique, finances et comptabilité, études et analyses, services numériques et data, information et communication, RH et services généraux. Cette petite taille nous rend très agiles et tous les collaborateurs sont des experts pointus.
L’une des missions de l’Unedic est de garantir le financement de l’Assurance chômage. Quand l’économie va bien, les cotisations (et donc nos recettes) augmentent et les dépenses d’indemnisation du chômage baissent. Quand l’économie va moins bien, c’est l’inverse. Nous devons garantir le financement et donc gérer la dette : ce n’est pas France Trésor mais nous-mêmes qui émettons et gérons la dette. En flux, cela représente environ 40 milliards d’euros par an. 11 % du recouvrement sert à financer l’opérateur France Travail.
Le financement de l’Unedic provient des cotisations recouvrées par les URSSAF, d’une part de la CSG attribuée par l’État et également, pour le régime agricole, de cotisations provenant de la MSA.
En tant qu’association paritaire, nous avons une direction paritaire représentant plus de 31 millions d’actifs et plus de deux millions d’employeurs. Nous avons aussi dans notre mission de les informer et les éclairer au même titre que l’ensemble des citoyens au travers d’études chiffrées, de vérification de faisabilité des mesures, etc.
Nous devons aussi prescrire et sécuriser les règles d’indemnisation.
Enfin, nous devons accompagner la mise en œuvre des règles d’assurance chômage auprès de notre opérateur France Travail.
Notre activité peut subir des évolutions brutales. Par exemple, avant la crise sanitaire Covid-19, l’activité partielle était marginale. Avec la crise, il a fallu financer 18 milliards d’euros dont 14 sur la seule activité partielle.
Retrouvez Vincent Roberti à la Nuit de la Data et de l’IA
Vincent Roberti est membre du jury des Trophées de la Nuit de la Data et de l’IA. Il va donc assister aux présentations des candidats le 15 janvier 2025 et interviendra à la cérémonie le 3 février 2025 au Théâtre de la Madeleine.
Quelle est l’organisation de cette direction des services numériques et de la data ?
Nous sommes 22 collaborateurs en deux sous-directions.
Tout d’abord, il y a la maîtrise d’ouvrage stratégique : une MOA pour les projets tiers ayant un impact sur l’assurance chômage. Par exemple, cela peut concerner le GIP-MDS (que nous finançons à hauteur de 11 %), la mission interministérielle de la donnée sociale… Son action est très en amont sur tous les projets afin d’en maîtriser les évolutions impactant l’assurance chômage.
La deuxième sous-direction est celle des SI. Une équipe IT s’y occupe des infrastructures, une dédiée à la data est en charge de la plateforme sous Cloudera et de ses usages et, enfin, un service métiers développe des solutions métiers. Nous faisons en effet beaucoup de produits en interne.
Techniquement, quelles sont les caractéristiques de votre plateforme data ?
Le datacenter affecté à notre Big Data est on premise avec une réplication distante. Notre plateforme est sous Cloudera depuis 2019. Auparavant, nous utilisions la plateforme SAS Institute de France Travail (Pôle Emploi à l’époque). Bien entendu, le changement a entraîner la nécessité de former nos équipes à de nouvelles technologies (Python, R…).
Lors des dernières négociations paritaires, la demande en études a été dix fois plus importante que dans les cycles précédents. Certains traitements ne prennent plus aujourd’hui que quelques minutes en se basant sur la totalité de nos données alors que, jadis, nous n’utilisions qu’un échantillon et il fallait plusieurs heures.
Quand on évoque la data à l’Unedic, de quoi parle-t-on ?
Nous utilisions une partie du Fichier National des Allocataires de France Travail.
Depuis 2022, nous récupérons dans la DSN les données déjà collectées par France Travail (l’Unedic n’étant pas prévue dans le décret de 2013, nous ne sommes pas utilisateurs directs de la DSN). Utiliser la DSN permet une meilleure compréhension du parcours d’emploi afin de connaître l’état du marché de l’emploi.
Nous défendons un rôle dans la donnée sociale et, en particulier, nous veillons à la qualité de de la donnée de la DSN afin d’intervenir au plus tôt en cas de difficulté.
Depuis 2022, nous avons un portail open-data proposant des données agrégées grâce à une implémentation d’OpenDataSoft. Ce portail vise à accroître la transparence vis-à-vis de la presse ou du public et à bien valoriser la source des données.
La donnée que nous utilisons, c’est aussi le référentiel des métiers de France Travail, des données agrégées des URSSAF et du GIP-MDS… Une évolution juridique en cours devrait nous permettre aussi d’accéder à des données du RGCU (Répertoire Gestion des Carrières Unique) tenu par la CNAV…
Et puis nous récupérons aussi des données externes telles que celles de la météo, de l’IGN… Par exemple, cela nous sert pour réaliser une étude d’impact sur le niveau d’utilisation de l’activité partielle par les entreprises et la survenance de catastrophes naturelles. Il s’agit de démontrer les corrélations existantes, qui pourront aider à améliorer la gestion prospective du financement de l’activité partielle (rappelons que l’Unédic finance 33 % de l’activité partielle, l’Etat 67 %).
L’IA est-elle un sujet pour vous et, si oui, pour quels usages ?
En 2019, nous avons créé, sur un extranet, un chatbot avec l’éditeur toulousain Synapse pour que collaborateurs et partenaires sociaux puissent poser des questions sur l’ensemble des textes régissant notre domaine.
En 2024, nous avons fait évoluer l’outil, en mode IAG, pour générer une réponse dédiée aux experts.
Enfin, en 2024, nous avons mis en œuvre une data fabrik. Désormais, quand une direction métier réalise une demande, d’abord, il faut vérifier que la donnée existe et est de qualité suffisante. Puis nous accompagnons les métiers dans le développement. L’IA étant partout, chacun doit adopter les bonnes pratiques. Nous sommes donc en train de former tous les collaborateurs à l’IA et à l’IAG.
Enfin, quels sont vos défis en 2025 ?
Nous devons accroître la capacité à fournir des analyses sur la data. Et cela implique aussi d’accroître notre cybersécurité. Nous sommes le seul organisme de la sphère sociale à être certifié ISO 27001. Les cyber-attaques s’accroissant, notre budget cybersécurité a augmenté en 2024 et pour 2025.
Nous voulons améliorer la maîtrise des projets data et reprendre la main sur l’accès à la data.
Bien sûr, nous devons nous adapter aux évolutions des fichiers de France Travail et éviter d’être désynchronisé d’eux afin de rester une partie prenante pertinente de notre domaine.
Podcast - Le patrimoine data de l’Unedic : l’étendre et le sécuriser
Pour remplir ses missions de service public, l’Unedic a besoin d’utiliser une quantité croissante de données. Vincent Roberti, directeur des services numériques et de la stratégie de la donnée de l’Unedic, explique ce qu’est cette association, ses rôles et comment ce patrimoine data s’étend ainsi que quels sont les enjeux associés. En particulier, l’Unedic est aujourd’hui certifiée ISO 27001.