Thierry Champéroux (MAIF) : « l’IA doit bénéficier d’un Maintien en Conditions Intelligentes »
Par Bertrand Lemaire | Le | Gouvernance
Thierry Champéroux, Chief Data Officer et directeur de la direction data et IA de la MAIF, explique l’usage de la data et de l’IA chez l’« assureur militant ».
Pouvez-vous nous présenter la MAIF, l’une des rares mutuelles qui ne se soit pas regroupée avec une autre ?
En effet, nous n’avons pas fusionné avec d’autres mutuelles mais nous avons tout de même constitué un groupe en rachetant d’autres structures comme la mutuelle des collectivités locales, la SMACL, et Altima (B2B2C, offres via des intermédiaires ou des contrats collectifs). Nous avons également notre filiale d’assurance-vie, MAIF-Vie. Notre activité est classique : l’assurance de biens (automobile, habitation…) et de personnes (santé…) ainsi que l’épargne et la prévoyance.
Nous avons actuellement plus de quatre millions de sociétaires, essentiellement des personnes physiques mais aussi des associations (nous sommes la première mutuelle pour le secteur associatif), quelques entreprises et des collectivités (SMACL). Nous disposons de plus de douze millions de contrats (dont 3,7 pour des véhicules) générant un chiffre d’affaires de l’ordre de 4,7 milliards d’euros nous amenant à gérer 22 milliards d’actifs en investissements, toujours éthiques et responsables.
Quel est votre périmètre et votre rattachement ?
Je suis Chief Data Officer et directeur de la direction de la data et de l’intelligence artificielle. Je suis rattaché directement à Hélène N’Diaye, directrice générale adjointe en charge de l’Assurance de Personnes, des Investissements, de l’Actuariat et de la Data, et directrice générale de MAIF-Vie.
Pour bien comprendre comment nous sommes organisés et pourquoi, je vais faire un peu d’histoire.
En 2012, nous avons réuni fonctionnellement les compétences data de toutes les directions pour refondre notre décisionnel mais chacun restait hiérarchiquement dans sa direction d’origine. En 2017, nous avons créé la Data Factory. Enfin, en 2022, nous avons créé la Direction Data et IA pour exploiter la donnée et mettre en œuvre l’IA au bénéfice de tout le groupe. Cette direction compte aujourd’hui 240 personnes.
Les compétences en data-science sont bien sûr au sein de la direction data et IA mais aussi dans d’autres directions (marketing, actuariat…). Sur des sujets très pointus, des équipes conjointes peuvent être hébergées au sein des directions métier impliquées. Par exemple, nous avons constitué la cellule climat en réunissant des collaborateurs de la direction de la tarification et de la direction data et IA. Nous avons une squad Géodatabuh : son objectif est le suivi des données de la météo, des sols, des constructions, etc. , bref de collecter toutes les données sur les aléas et les vulnérabilités. La deuxième crée les modèles pour prévoir la probabilité de survenance d’un sinistre.
De quelles données parle-t-on ?
Nous n’avons pas d’originalité. Comme toutes les banques et les assurances, nous avons des données corporate classiques, des données sur les clients et les contrats ainsi que des données de sinistralité. Ce qui est plus récent, au-delà de ces données structurées, c’est que nous exploitons aussi des données de flux d’interactions (e-mails, conversations téléphoniques, etc.).
Et pour quels usages ?
Bien évidemment, nous réalisons des calculs actuariels pour créer nos modèles de tarification, y compris avec de l’IA pour modéliser les évolutions climatiques. Nous avons aussi des traitements marketing.
Mais, en fait, toutes les directions du groupe sont clientes de la Direction Data et IA pour l’ensemble des besoins en analytique et en IA.
Comme, à la MAIF, nous avons comme valeur forte la qualité de la relation client, nous axons fortement l’exploitation de la donnée au service de cette qualité. La direction de la relation sociétaires est donc notre principal client interne.
Nous devons mettre à disposition de tous les données pour analyser, comprendre et décider. De ce fait, tous les collaborateurs du réseau ont accès aux données nécessaires pour piloter leur propre activité et, selon le niveau hiérarchique, chacun dispose du reporting adapté à ses fonctions. Cela implique de collecter toutes les données, notamment issue des systèmes de gestion, de les mettre en qualité puis à disposition de tous les métiers.
Une deuxième grande famille d’usages est autour de l’IA.
Quels sont vos usages en matière d’IA ?
Par exemple, nous exploitons la donnée pour optimiser la qualification et le routage des flux entrants afin de mettre en relation le sociétaire avec le bon contact interne. En amont, il y a la téléphonie avec la reconnaissance du numéro ou les métadonnées des mails et nous croisons ces informations avec les données internes (comme l’existence d’un dossier de sinistre en cours) pour bien diriger la prise de contact. L’objectif est d’éviter au maximum de la perte de temps avec des renvois, des transferts, etc. Pour nous, c’est un très gros enjeu car 80 % des contacts entrants s’opèrent par téléphone. Nous avons ainsi quinze millions de conversations téléphoniques par an (aucune n’est aujourd’hui conservée pour une post-exploitation par de l’IA). A l’inverse, le flux papier est en nette régression, bien sûr. L’IA est aussi utilisée pour toutes sortes de scorings marketing (appétence à des offres, choix du canal de sollicitation…), réglementaires (lutte anti-blanchiment) ou de détection de fraudes.
Un point est très important pour nous : l’IA doit bénéficier d’un Maintien en Conditions Intelligentes (MCI). Sur le modèle du Maintien en Conditions Opérationnelles (MCO), il s’agit de faire en sorte que l’IA reste pertinente dans le temps, ce qui passe notamment par un travail constant sur les données utilisées.
Et comment traitez-vous le risque climatique ?
L’open-data promue par le gouvernement est très utile pour développer nos modèles. Il s’agit bien sûr de prévoir le risque de sinistralité. Mais aussi, pour nous, de prévoir les moyens humains nécessaires en cas de sinistre. Si, suite à une catastrophe, nous devons traiter dans l’urgence 100 000 dossiers de sociétaires en détresse, cela ne s’improvise pas. Et la question est à voir de la première sollicitation au règlement final.
Le rapport de Thierry Langreney sur l’assurabilité des risques climatiques a été récemment remis aux ministres Bruno le Maire et Christophe Béchu. Il vise à poser un cadre pour gérer la couverture de zones où les assureurs ont tendance à se désengager. Cela peut passer par des grilles de risques plus ou moins élevés sur une carte. Le coût de sinistralité double tous les dix ans sur le risque climatique…
Quels sont vos grands projets actuels ?
Nous avons des projets dans chacune de nos trois grands activités au sein de la direction Data et IA.
La première de ces activités, c’est la plate-forme technique et les outils autour de la data. Notre grand projet en cours, c’est la replateformisation en cours. Nous avions un SGBD-R Oracle, un datalake Haddop/Cloudera et une appliance Netezza d’IBM. Nous sommes en train de remplacer tout cela par une plateforme Greenplum on premise. Ce choix du on premise est majeur pour nous pour toutes les données concernant nos sociétaires. « Assureur militant », c’est aussi de n’avoir aucun hébergement des données de nos sociétaires chez des prestataires cloud non-souverains. Cela dit, nous ne nous interdisons pas d’utiliser la puissance de calcul du cloud en mode flux, par exemple, pour nous, du GPU sur le PaaS Azure.
La deuxième activité, ce sont les analytics. Cela concerne la collecte de la data des systèmes de gestion portés par la DSI, la mise en qualité, l’historisation (en fonction des limites réglementaires comme le RGPD) et l’exploitation de la data pour créer les tableaux de bord tant du quotidien que du pilotage comme je l’indiquais tout à l’heure. Là, il n’y a pas vraiment de grands projets actuellement : sur cette activité, nous privilégions les petits projets en mode agile. Les thèmes de projets aujourd’hui tournent beaucoup autour d’enjeux de réglementation (lutte anti-blanchiment…), la lutte contre la fraude, le pilotage économique (y compris au niveau des sinistres dont les sinistres climatiques) et la self-data. Sur ce dernier point, il s’agit de rendre davantage autonomes les métiers pour éviter autant que possible que la direction data soit un goulet d’étranglement.
La troisième activité, c’est bien sûr l’IA. Nous développons avec nos propres ressources et avec des outils open-source, nos solutions. Le recours à l’open-source, c’est bien sûr notre côté « assureur militant » mais nous publions aussi nos travaux et nous sommes de ce fait connus dans la communauté. Par exemple, nous travaillons sur Mélusine pour qualifier les appels entrants, Shapash pour expliquer nos modèles IA (ce qui sert à expliquer à un sociétaire pourquoi un tarif varie notamment)… Nous avons une grande quantité de projets IA autour du scoring, que ce soit au service de nos conseillers pour les aider dans leur relation avec les sociétaires ou, dans le canal digital, directement au service de nos clients pour les guider.
En matière d’IA, le grand sujet du moment, c’est évidemment l’IAG. Déjà, il faut bien faire comprendre à chacun ce dont il s’agit. L’IAG touche potentiellement tous les métiers, avec des priorités certes variables, ce qui pourrait impacter le quotidien de chaque collaborateur dans les prochaines années. En amont d’un projet d’IAG, il y a donc des sujets d’acculturation de l’entreprise, de compétence, de formation…
Chaque semaine, il y a de nombreuses nouveautés. Mais quelle est l’utilité de chacune ? Quel en est l’impact ? Il ne s’agit pas de mettre du ChatGPT partout ! Nous avons besoin d’usages éthiques, responsables, au service des humains. Il est sans doute pertinent d’attendre les SML (petits modèles de langage) plutôt que de recourir tout de suite aux LLM (grands modèles de langage) beaucoup plus gourmands en ressources, d’employer des technologies souveraines (Mistral.ai…) plutôt que des systèmes non-souverains (ChatGPT, Bard…). Nous expérimentons beaucoup pour ne pas prendre de retard mais nous nous posons aussi beaucoup de questions. Il est difficile d’identifier de façon exhaustive les cas d’usages de l’IAG tant les gisements sont nombreux. Mais il est indispensable de bien penser les fondamentaux avant de se lancer sur de gros projets. Et, bien sûr, il ne faut pas oublier que l’IA, particulièrement l’IAG, repose sur la data. Pour avoir une IA efficace, il faut donc soigner en amont la data.
Votre siège est à Niort. N’est-ce pas un handicap dans la guerre des talents ?
Les équipes data sont effectivement majoritairement à Niort mais nous en avons un peu à Paris. La région de Niort est attrayante : nous sommes à trente minutes de l’océan, quarante de l’île de Ré, à proximité du Marais Poitevin… et les coûts de l’immobilier ne sont pas parisiens ! Ces éléments d’attraction ne sont pas neutres. Les centres de décision placé en Province sont rares en France. Nous proposons aussi jusqu’à trois jours de télétravail par semaine. De ce fait, il y a un vrai confort et la possibilité de ne pas habiter Niort même. « Assureur militant », c’est aussi de bonnes conditions de travail !
De plus, pour notre recherche de talents, nos publications open-source facilitent les choses puisque nous sommes connus de la communauté. Nous développons beaucoup car nous avons une vraie volonté de maîtrise interne sans aucun effet de boîte noire.
Alors, certes, cela reste compliqué de recruter des data scientists ou des data engineers mais nous y arrivons. L’évolution peut être lente dans une grande entreprise comme la nôtre : cela peut inciter certains à aller voir ailleurs. Mais il ne suffit pas de recruter : il faut aussi faire monter nos collaborateurs actuels en compétences, aussi pour soigner leur employabilité.
Enfin, quels sont vos défis pour 2024 ?
Le virage vers l’IA générative est sans doute un élément majeur dans nos réflexions en cours afin de définir la bonne direction pour les années à venir et bien accompagner la MAIF sur une évolution au long cours.
Parmi les sujets, il y a le traitement des éventuelles contradictions comme entre notre responsabilité sociétale, l’explicabilité des décisions et des algorithmes, l’emploi de machine learning dont les résultats peuvent ne pas être explicables, la consommation de ressources considérable de l’IA peu compatible avec le défi climatique…
Podcast - Le Maintien en Conditions Intelligentes, clé d’une IA fiable à la MAIF.
Thierry Champéroux est Chief Data Officer et directeur de la direction data et IA de la MAIF. Il explique ici comment l’IA est utilisée à la MAIF et surtout avec quelles précautions. Le « Maintien en Conditions Intelligentes », c’est d’abord de vérifier la pertinence des données et la qualité des modèles utilisés au fil du temps.