Julie Pozzi (Air France-KLM) : « pas de valeur data sans bon accompagnement des utilisateurs »
Par Bertrand Lemaire | Le | Gouvernance
Cet article est référencé dans notre dossier : Nuit de la Data et de l'IA 2024 : retours sur la célébration des innovations data/IA
Julie Pozzi, head of operations research, data science et data strategy d’Air France-KLM, détaille ici les approches et la stratégie data du groupe.
Pouvez-vous nous présenter le groupe Air France-KLM ?
Le Groupe Air France-KLM dispose d’un réseau mondial comprenant plus de 300 destinations, desservies grâce à Air France, KLM Royal Dutch Airlines et Transavia. Fort de trois grands pôles d’expertises (le transport aérien de passagers, le fret et la maintenance aéronautique), Air France-KLM constitue aujourd’hui un acteur mondial de premier plan.
Avec une flotte de 522 avions il dessert jusqu’à 300 destinations dans 120 pays, principalement depuis nos hubs de Paris-Charles de Gaulle et Amsterdam-Schiphol. En 2022, nous avons transporté 83 millions de passagers à travers le monde et comptons 73 000 collaborateurs.
Comment sont organisés la data et l’IT ?
Pour nous, la data et l’IA sont très loin d’être des sujets nouveaux. Dès les années 1960, nous avions des outils embarquant des modèles de prédiction et de prescription (optimisation). Notre datawarehouse date de 2001. Historiquement, le sujet « data » est donc extrêmement fort au sein du groupe et les compétences assez centralisées à l’IT.
Depuis trois ans, nous avons défini notre stratégie Data et accompagnons la transformation du Groupe et d’Air France, comme le témoigne la création d’une Data Factory au cœur du Siège et nous avons pour mission de démocratiser les usages de la donnée au sein des différents métiers.
Pour l’heure, le rôle de Chief Data Officer (CDO) du Groupe est porté par le CIO qui a donc un rôle de définition de la stratégie data, de la gouvernance data… tout en étant un enabler technologique data pour les métiers.
La Data Factory a pour objectif d’accélérer cette transformation data sous les aspects démocratisation, acculturation, professionnalisation : co-pilotée par l’IT et la Transformation d’Air France, elle réunit tous les métiers qui le souhaitent avec des experts de la Data Science, du Data Engineering, de la Transformation mais aussi des RH et de la Communication.
Retrouvez Julie Pozzi à la Nuit de la Data
Julie Pozzi fait partie du jury des Trophées de la Nuit de la Data. Elle assistera donc aux présentations des candidats ayant déposé un dossier le 18 janvier 2024 et vous la retrouverez à la cérémonie de la Nuit de la Data le 5 février 2024.
Quels sont vos grands choix techniques et d’architecture ?
Nous avons un environnement data centralisé, une architecture data unifiée, même si techniquement historiquement Air France utilise Teradata et KLM SQL Server. Nous sommes actuellement en train de réaliser un move-to-cloud, en l’occurrence vers Google Big Query, en unifiant les technologies. Nous en profitons d’une part pour réaliser une montée en puissance en migrant tous les outils développés on premise, d’autre part en rationalisant les usages sans perturber le business. Etant donné le nombre de rapports qui existe actuellement, avant d’en migrer un, nous interrogeons le business sur son utilité.
Depuis quelques années, nous avions un outil de data catalog très peu utilisé par les métiers. En parallèle du move-to-cloud, nous déployons à la place Collibra en alignant les data models.
Côté analytique, nous déployons Power BI qui va contribuer à démocratiser les usages data, en complément des outils déjà présents dans notre portefeuille comme Spotfire.
Mais il faut garder en mémoire qu’un outil, même le meilleur du monde, n’apportera de la valeur que s’il y a le bon accompagnement des utilisateurs et la bonne gouvernance mise en place
Typiquement, nous voulons éviter de voir plusieurs services recalculer le même indicateur-clé de performance (KPI) avec des variations sur la définition qui nous font perdre un temps considérable en réconciliation. Nous voulons que tout le monde partage les mêmes KPI avec les mêmes définitions, calculés une fois pour toute sans perdre du temps en réconciliation entre chiffres incohérents.
En quoi consiste la data dans un groupe comme le vôtre ?
Bien évidemment, il y a les usages corporate classiques.
Côté data clients, nous avons construit une base de données qui nous permet d’avoir une vision à 360° des clients. Si un client prend contact avec nous, la personne qui répond doit avoir systématiquement toute l’information nécessaire pour pouvoir apporter la réponse appropriée et pousser, le cas échéant, la bonne offre, au bon client, au bon moment, grâce à nos outils de recommandation. Cet outil 360° est bien sûr temps réel mais fournit également de la donnée dans le monde entier, dans toutes les escales et sites Air France KLM.
La data est aussi très présente côté Opérations. Nous réalisons, je l’ai dit, depuis des années, de la prédiction d’activité pour pouvoir dimensionner les équipes, commander les plateaux-repas, etc. Et, comme vous le savez, Air France dispose de son propre outil de revenue management pour optimiser la tarification en fonction de la demande de trafic.
Nos modèles permettent aussi de prédire les aléas. Par exemple, nous pouvons anticiper le no-show (passagers ayant réservé mais absents à l’embarquement) et le go-show (passagers en avance pouvant prendre un vol précédent), mais également le nombre de bagages en cabine.
Nous effectuons aussi de la maintenance prédictive. Celle-ci s’est bien développée depuis l’arrivée de l’A380. Cet avion était en effet bien plus « bavard » que ses prédécesseurs, nous permettant d’éviter une panne impromptue à l’autre bout du monde avec toutes les difficultés induites pour les passagers, les équipages, le dépannage, etc.
Nous prévoyons également le retard des vols pour l’éviter et anticiper ces aléas, et cela dès les phases amont de la planification dès six à neuf mois à l’avance. En effet, on peut prédire une saturation d’un hub comme Paris Charles De Gaulle avec des passagers qui vont avoir du retard à l’embarquement, pour réaliser une correspondance ou d’autres types de difficultés. Nous allons donc, dans ce cas, prendre des mesures pour éviter des répercussions en chaîne des retards accumulés au fil de la journée. Pour cela, nous recourons au machine learning pour mener à bien la prédiction, puis à l’optimisation pour planifier nos ressources de la façon qui sera la plus robuste possible au jour J
Comment procédez-vous pour garantir une mise à disposition d’une data de qualité en temps réel ?
Nous avons une logique produit en associant les métiers et l’IT. Nous voulons une bonne data à l’entrée, la traiter avec le bon outil et avoir la bonne réponse à la sortie.
L’approche la plus simple est celle dans laquelle chaque cas d’usage commence par identifier les données nécessaires : la mise en qualité des données dépend des cas d’usage qui ont une valeur facile à démontrer.
Mais avoir une telle approche peut nuire à l’agilité et à une livraison dans le bon délai d’un projet. Elle ne permet pas non plus une mutualisation des coûts de mise en qualité des données entre différents petits projets à plus faible valeur.
Nous travaillons donc aussi désormais sur une stratégie globale de mise en qualité des données, en priorisant ce travail de préparation selon les usages anticipés. L’objectif est d’éviter de rester bloquer trois mois dans un projet parce qu’il faut démarrer par mettre la donnée en qualité. Cette approche implique de se doter de profils de Data Steward dans l’ensemble de nos métiers, ce qui est un autre défi !
Car si tout le monde veut être data scientist, le chevalier blanc de la data, il est plus difficile de faire comprendre l’importance et la valeur du data steward alors que son rôle est tout aussi indispensable. Nous avons donc pro-activement créé des postes de data steward en central, et les gréons via un parcours de reconversion pour qu’ils aient une connaissance profonde du métier dont ils vont gérer les données.
Que signifie, dans un groupe comme le vôtre, démocratiser la data ?
N’importe où dans l’entreprise, n’importe quel collaborateur doit être en mesure de prendre ses décisions en fonction de données qu’il maîtrise. Cela signifie qu’il connaît sa donnée, ce qu’elle signifie, qu’il sait où la trouver et comment l’interpréter. Tout le monde n’est pas data scientist mais tout le monde prend des décisions. Il faut que celles-ci soient basées sur des données maîtrisées. Il faut que les métiers aient la plus grande autonomie possible, notamment sur des choses, parfois, qui sont simples.
La guerre des talents data est-elle un sujet quand on est une compagnie aérienne ?
Oui, bien sûr. Mais notre maturité data et le fait que les équipes data centralisées adressent des cas d’usages pour l’ensemble des métiers du groupe, , fait que notre entreprise est un terrain de jeu très attractif pour les profils data et IA
Le sourcing des data engineers est plus problématique parce qu’il y a une vraie pénurie. Depuis cinq ans, les écoles forment des data scientists en grande quantité, au détriment des data ingénieurs. Nous voyons une nouvelle fois une difficulté à rapprocher les formations qui existent des vrais besoins des entreprises.
On ne peut donc pas dire qu’il y a une vraie guerre des talents mais, par contre, nous avons besoin que les bonnes formations existent. Et puis il faudrait féminiser les métiers techniques.
Pour terminer, quels sont vos défis pour 2024 ?
Tout d’abord, nous avons encore à démontrer la valeur de l’intelligence artificielle générative (IAG). Nous avons des démonstrateurs partout mais nous travaillons sur des cas d’usages industrialisés avec de vrais gains.
Le move-to-cloud constitue aussi un défi car nous avons un historique de plus de vingt ans à migrer… sans rien casser !
Enfin, la démocratisation de la donnée reste un défi. Changer la culture est même un défi de tous les instants et qui nécessite un effort continu.
Podcast - Air France KLM a structuré sa fonction data dans une data factory
Le groupe Air France KLM possède deux compagnies aériennes principales : Air France et KLM. Derrière, plusieurs filiales existent, notamment Transavia. Et le groupe a trois métiers principaux : le transport de passagers, le transport de fret et la maintenance aéronautique. Comme Julie Pozzi, head of operation research, data science et data strategy d’Air France-KLM, le rappelle : historiquement, la data est directement rattachée à la fonction IT mais, désormais, le groupe a constitué une data factory.