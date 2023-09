Tout ce que vous écrirez pourra être retenu contre vous. Plusieurs superviseurs financiers européens développent actuellement des outils de traitement automatique du langage naturel (natural-language processing ou NLP) pour analyser rapidement toute la production écrite entrant dans leur champ de compétences, tels les prospectus de fonds, les rapports annuels et réglementaires ou les communiqués de presse.

Le NLP, qui a fait sensation récemment avec les prouesses de ChatGPT, est une technologie plus vaste qu’un agent conversationnel intelligent. A l’aide de concepts linguistiques et d’intelligence artificielle (IA), des programmes informatiques peuvent désormais comprendre, manipuler et générer du langage similaire à celui des humains. Et lire efficacement des milliers de documents, voire analyser les relations entre des mots et des groupes de mots selon les contextes. Pour le superviseur, cela veut notamment dire pouvoir identifier et signaler des anomalies de manière automatisée, pour faciliter le travail des analystes. « Les outils du NLP permettent aux régulateurs de gagner du temps et d'être plus efficaces dans leur action de surveillance en concentrant leurs ressources limitées là où elles sont le plus nécessaires », résume Claudia Guagliano, directrice de l’unité d’analyse des consommateurs, du développement durable et de l’innovation à l’Autorité européenne des marchés financiers (Esma).

Evaluer la lisibilité et la complétude

Le gendarme financier européen s’est d’abord servi de la NLP pour lire plus attentivement près de 600.000 pages de prospectus financiers, tels que des documents d’informations clés aux investisseurs pour des fonds ou encore des prospectus d’émissions de titres. « Nous avons utilisé la NLP pour vérifier si la documentation fournie aux investisseurs, notamment particuliers, est claire et compréhensible, comme l’exige la réglementation applicable aux prospectus », explique Claudia Guagliano. Son équipe en a tiré plusieurs constats : certains documents étaient répétitifs, les facteurs de risques étaient parfois génériques et peu spécifiques, et, du côté obligataire, la longueur excessive de certains documents était associée à une plus grande divergence dans l'évaluation du risque de crédit par les agences de notation.

Dans la même veine, l’Autorité de contrôle prudentiel et de résolution (ACPR) a entre autres développé un outil capable de détecter dans des rapports légaux la présence d’éléments exigés par la réglementation, et de vérifer l’exhaustivité de ces documents, le tout sur un tableau de bord. « C’est un outil bien apprécié par nos collègues, car il permet d’avoir une première idée de la complétude d’un rapport et donc de sa conformité à la réglementation », indique Olivier Fliche, son directeur du pôle fintech-innovation.

Les outils du NLP permettent aux régulateurs d'être plus efficaces dans leur action de surveillance CLAUDIA GUAGLIANO, directrice de l’unité d’analyse des consommateurs, du développement durable et de l'innovation à l’Esma

L’adoption d’un outil de NLP est un travail collectif qui mobilise le pôle fintech ainsi que des contrôleurs, des experts juridiques, des responsables des données et des ingénieurs. Le développement d’un outil commence avec une analyse fine du processus du métier du contrôleur. « L’outil est ensuite assemblé, par exemple en codant les règles du métier, en recourant à un moteur de recherche intelligent ou un modèle de machine learning pour des travaux plus complexes et en proposant une interface utilisateurs la plus intuitive possible. Certains outils sont ensuite régulièrement alimentés avec des textes afin de les améliorer », détaille Olivier Fliche.

Ces super-lecteurs ne sont toutefois pas encore autonomes ni pleinement dignes de confiance. Par exemple, les lignes de code portent en elles beaucoup de biais humains. L’Esma, par exemple, fait fonctionner ses algorithmes de manière transparente pour que les différents employés puissent comprendre son fonctionnement étape par étape et suggérer des ajustements si nécessaire.

De nouveaux besoins humains

La protection des données est un autre sujet de préoccupation pour ces institutions, qui utilisent souvent des données confidentielles. Ce qui les oblige à circonscrire en interne la construction et l’utilisation de ces outils. L’ACPR, comme la Banque de France, n’utilise à ce jour ni cloud public ni ChatGPT. « Les données que nous utilisons sont pour la plupart issues des établissements que nous contrôlons. Nous devons en protéger la confidentialité. Ce sont des contraintes importantes que nous prenons en compte dans le développement de nos outils et dans les méthodes de supervision employées », précise Olivier Fliche.

Le développement d’algorithmes puissants pose aussi des défis opérationnels importants, comme la bonne uniformisation des documents à analyser dans des formats lisibles et surtout la mise à niveau fréquente des infrastructures informatiques, alors que la puissance de calcul requise croît de manière exponentielle.

Les outils NLP semblent désormais incontournables pour les superviseurs et cela se ressent dans le recrutement. L’Esma requiert des candidats aux postes d’économiste ou d’analyste des risques de maîtriser Python, un logiciel clé dans l’utilisation du NLP.

La mise en place d’outils boostés au NLP implique par ailleurs qu’il soit facilement utilisable par les équipes. Or il faut deux à trois ans pour avoir un taux d’utilisation satisfaisant des outils, selon Olivier Fliche. L’ACPR a donc largement sensibilisé et formé sur le sujet en interne, y compris sa direction, car ces outils affectent le processus de contrôle et la gouvernance.

Peut-on envisager qu’un jour un algorithme soit capable d’analyser un document, de détecter une infraction, puis de sanctionner une entreprise de manière autonome ? « Les systèmes d’IA sont très puissants pour rechercher des informations et faire des synthèses. En revanche, ils ne peuvent pas vérifier les faits. L’IA n’est pas encore capable de tout faire », tempère Olivier Fliche. ■

LE NLP TESTE LE VOCABULAIRE DE LA FINANCE DURABLE

Le NLP permet aussi de vérifier l’usage des mots dans le domaine de la finance durable. L’Esma cherche par exemple à contrer le greenwashing dans la gestion d’actifs sur la base d’algorithmes qui prennent en compte, entre autres, une liste de 4.000 mots relatifs à la finance durable. « Nous constatons que les documents marketing font souvent la promotion des aspects ESG des fonds, avec des formulations qui, dans certains cas, sont très différentes de la manière dont elles sont reflétées dans les documents réglementaires », synthétise Claudia Guagliano, directrice de l’unité d’analyse des consommateurs, du développement durable et de l’innovation à l’Esma.

Sur le climat, les équipes de la Banque de France et de l’ACPR travaillent actuellement sur un outil sophistiqué mixant analyse quantitative et NLP pour estimer les émissions carbone financées par les banques et les assureurs. « Notre outil produit une estimation des émissions carbone financées par ces établissements, et permet une analyse comparative avec les déclarations d’émissions présentes dans les rapports publiés par ceux-ci », dévoile Jules Pondard, responsable de projets numériques à l’ACPR.