BNP Paribas PF limite la fraude grâce à l’IA
Par Bertrand Lemaire | Le | Cas d’usage
En recourant à une base de données orientée graphe (Neo4j) et à l’IA, BNP Paribas Personal Finance (BNPP-PF) entend fortement limiter la fraude au crédit à la consommation.
Filiale à 100 % du groupe BNP Paribas, BNP Paribas Personal Finance (BNPP-PF) est spécialisée dans les activités de crédit à la consommation (notamment avec la marque Cetelem). Elle revendique la première place du financement aux particuliers en Europe. Parmi ses produits, BNPP-PF propose des crédits courts en mode de paiement sur des sites e-commerce, le « paiement fractionné » en trois à quatre échéances d’au plus trois mille euros sur un maximum de quatre-vingt-dix jours. Ce type de paiement est notamment utilisé sur des sites proposant de la Hi-Tech, de la mode ou des voyages. Mais il s’agit là d’un processus d’octroi de crédit qui doit être d’une extrême fluidité, quasiment instantané, afin de ne pas entraîner de renoncement à un achat. Comme tous ses concurrents, BNPP-PF doit faire face à de la fraude et doit donc limiter cette fraude sans ralentir le processus d’acceptation ou de refus de crédit.
Classiquement, la fraude est analysée grâce à des mécanismes assez basiques comme les listes noires d’exclusion et des scorings de critères comportementaux. Dans le cas du paiement fractionné, les informations demandées au client doivent être limitées et les analyses de scores sont plutôt simples. La difficulté réside dans le petit nombre d’informations disponibles et la nécessaire instantanéité de la décision d’acceptation ou de refus. Toute amélioration des algorithmes est évidemment rapidement contrecarrée par les fraudeurs. « C’est un jeu du chat et de la souris » soupire Mehdi Barchouchi, responsable innovation data et outils chez BNP Paribas Personal Finance. Le but étant d’accorder des crédits, activité de l’entreprise, il faut également limiter au maximum les faux positifs dans la détection de fraude.
Décider grâce aux connections entre dossiers
Pour faire évoluer la détection de fraude, BNPP-PF a décidé de tenir compte des connexions et similitudes entre dossiers de crédits. La connexion peut être directe grâce à un élément commun entre un dossier A et un dossier B : un e-mail, un numéro de téléphone… Elle peut aussi être indirecte entre A et B, c’est à dire qu’un dossier A a des choses en commun avec un dossier C qui lui-même a des choses en commun avec le dossier D qui sera similaire avec le dossier B. L’enjeu, pour BNPP-PF était de développer les analyses de connexions indirectes. Or, techniquement, tenir compte d’une liste noire est aisé avec un système de gestion de base de données relationnelle. Mais pas une analyse de relations. Mehdi Barchouchi relève : « le problème est surtout sur les temps de réponses car plus la relation est indirecte, plus le nombre de dossiers et plus la taille de la base de données s’accroît, plus les délais de réponse explosent. »
BNPP-PF cherchait donc une solution alternative. Edouard Tabari, responsable innovation et data science chez BNP Paribas Personal Finance, déclare : « nous avons décidé de mettre en œuvre une base de données orientée graphe, en l’occurrence Neo4j, et de l’IA. » Chaque nœud de la base de données est un dossier et on lui attribue une « couleur » relative à son statut (remboursement sans problème, des retards, fraude…). Puis les dossiers sont reliés en fonction de leurs points communs en un réseau (ou graphe). Il semblerait que plus la taille du réseau lié à un dossier est importante, plus le risque de fraude est élevé. « Le risque moyen de fraude est de 2 % mais la probabilité monte à 25 % si un dossier est relié à un dossier avec fraude » observe Edouard Tabari.
Traitement en mémoire et IA
Le traitement du graphe se fait en mémoire vive, tout comme, bien sûr, l’exécution des algorithmes de détection. L’application mise en œuvre est également capable d’apprentissage automatisé (machine learning) pour améliorer la prédiction de fraude. Mehdi Barchouchi note : « Neo4j nous a accompagnés dans la mise en œuvre, notamment la migration de notre SGBD-R vers leur technologie avec la réécriture de nos requêtes et algorithmes. » Selon l’éditeur, la base de données de Neo4J est capable de traiter jusqu’à 1012 nœuds. De plus, l’accès aux données peut être paramétré selon les profils d’utilisateurs : totalité des informations de chaque nœud et chemin ou juste le chemin ou juste certains types de données, etc.
En raison de la réglementation, tous les traitements et stockages de données doivent impérativement être réalisés sur les systèmes propres de BNPP-PF, même si Neo4J propose évidemment une version totalement hébergée et managée de sa technologie. Mais l’une des difficultés rencontrées n’était pas technique. Mehdi Barchouchi raconte : « certaines personnes refusent de donner leur téléphone et indiquent un numéro type 06 00 00 00 00. Du coup, ces personnes sont reliées entre elles par le système. Il faut alors intervenir pour supprimer ce type de connexions. »