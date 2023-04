La course à l’intelligence artificielle (IA) générative, la dernière tendance technologique qui enflamme les investisseurs, commence à nourrir aussi des perspectives dans l’univers de l’information financière.

Bloomberg a tiré le premier en annonçant, fin mars, travailler à son propre modèle d’intelligence artificielle générative – capable de créer des contenus (texte, code, image ou son) ou de répondre à des questions en s’appuyant sur des données existantes.

L’agence de presse et d’information financière a fait son annonce quelques semaines après celle autour de ChatGPT, porté par la start-up OpenAI et Microsoft, puis celle du projet Bard d’Alphabet (Google).

L’initiative de Bloomberg paraît logique. La société, qui a développé avec succès ses activités dans les services aux professionnels des marchés financiers et l’information financière, est fondamentalement une société de gestion de données (data).

D’après le document de recherche détaillant le développement de BloombergGPT, écrit par les chercheurs de l’entreprise et de l’université Johns Hopkins, ce nouveau modèle d’IA générative reposera sur le grand modèle de langage (LLM, programme capable de générer des réponses à des questions formulées en langage courant) développé par Bloomberg.

Sa masse de données, une valeur ajoutée

La première version du modèle a été nourrie par une vaste masse de données (documents financiers, actualités, dépôts, communiqués de presse, médias sociaux) tirés des archives de Bloomberg, créé en 1981.

Car elle dispose d’une mine d’or : son activité historique de collecte d’informations et données financières du groupe, qui a nourri l’IA générative d’un ensemble de 363 milliards de tokens (unités de base du texte ou du code qu’une IA LLM utilise pour traiter et générer du langage). Ce à quoi s’ajoutent des données publiques, pour aboutir à un vaste corpus de formation comprenant plus de 700 milliards de tokens. Soit bien plus que GPT-3, le modèle de langage d’OpenAI publié en 2020, qui avait été entraîné sur environ 500 milliards de tokens.

Quels usages en fera Bloomberg ? Il ne le précise pas encore mais esquisse des pistes.

Détecter des « controverses sur les investissements, les clients et les fournisseurs, calculer des scores ESG et d’impact positif » Sylvain Forté, cofondateur de Sesamm, start-up de services financiers en IA

Réponses structurées

Premier cas de figure, « son agent conversationnel (chatbot) permettra de fournir une réponse structurée à une question telle que ’Quelles sont les entreprises qui ont le mieux performé dans les télécoms ces trois dernières années ?’ », anticipe Sylvain Forté, cofondateur de Sesamm, start-up de services financiers en IA. BloombergGPT pourra ainsi compiler et synthétiser des données telles que « des transcriptions de résultats annuels d’entreprises ou des rapports annuels, souvent longs et indigestes ».

Second usage possible, des métiers vont s’en emparer pour l’adapter aux besoins de leurs clients. C’est déjà le cas dans la finance. Sesamm elle-même, qui a levé 35 millions d’euros début mars, a sa propre solution d’analyse intelligente de données textuelles, qui permet d’analyser des milliards de documents (médias, rapports officiels…) afin de détecter des « controverses sur les investissements, les clients et les fournisseurs, de calculer des scores ESG [environnement, social, gouvernance] et d’impact positif ».

De même, la start-up américaine AlphaSense aide ses clients à extraire des informations pertinentes d’une multitude de contenus publics et privés tels que la recherche sur les actions, les earning calls et les publications publiques d’entreprises. Elle a bouclé en avril un tour de table de quelque 100 millions de dollars, mené par Alphabet (Google).

Ces IA génératives ont pourtant des limites. Par exemple, elles n’intègrent pas d’évaluation de la vérité. « Ce qu’une IA générative écrit, ce n’est pas le vrai mais ce qui est vraisemblable : elle peut inventer une réponse probable par défaut » sans être confrontée à une autre version des faits, avertit Jean-Gabriel Ganascia, professeur à Sorbonne Université et chercheur au Laboratoire d’informatique de Paris 6.