La plate-forme d’agrégation de données IODS prend forme

le 17/02/2011 L'AGEFI Hebdo

Pour offrir aux chercheurs un meilleur accès aux informations, l’Insead OEE Data Services rassemble des bases de données peu ou pas exploitées.

Dès mai 2011, IODS (Insead OEE*Data Services) proposera, pour les universitaires et les institutions financières, des bases de données dans quatre domaines : actions et fonds d’investissement, entreprises, marché obligataire, macroéconomie. La société a été fondée en décembre 2010 sur le modèle du Wharton Research Data Services, qui fournit déjà des données financières fiabilisées et mises en cohérence à l’ensemble des universités ainsi qu’à des établissements privés. IODS a pour objectif de constituer une plate-forme d’agrégation visant à regrouper, retraiter et structurer de manière homogène des volumes significatifs de données financières européennes en s’appuyant sur des sources de natures différentes (vendeurs de données, bases de données propriétaires…). L’ambition de IODS est d’offrir aux universitaires et chercheurs en finance des données de qualité, avec de la profondeur, des séries longues dans le temps et certifiées. C’est la condition nécessaire pour un travail académique impliquant des publications. Or, les fournisseurs de données de type Bloomberg ou Thomson Reuters ont privilégié le temps réel plutôt que les séries longues et normées, selon les promoteurs de IODS. Une situation d’autant plus compliquée en Europe où la fragmentation des marchés actions entraîne une disparité de traitement des ordres d’une Bourse à l’autre. Dans ce domaine, par exemple, IODS fournira non seulement les bases de données sur les cours, mais aussi une expertise sur le traitement des séries longues et une documentation sur les différents algorithmes. En outre, l’ambition de IODS est de restituer, dans la mesure du possible, toutes les bases de données existantes et souvent inexploitées.

Une architecture classique

Pour supporter son activité, IODS est en train de finaliser la conception d’une plate-forme informatique dédiée. Elle permettra le stockage des différentes bases de données, ainsi que leur diffusion selon les modalités des fournisseurs de données. C’est Eurofidai, une unité dépendant du CNRS, spécialisée dans le traitement des données boursières, qui est en charge de la maîtrise d’œuvre du projet. « Je m’occupe de la conception du cahier des charges relatif à la plate-forme informatique de l’agrégateur de données IODS : architecture, technologies logicielles, hébergement…, déclare Bernard Rapacchi, responsable des systèmes d’information d’Eurofidai. Dans la foulée sera lancé l’appel d’offres pour la SSII en charge du développement informatique et pour le prestataire en charge de l’hébergement. » L’architecture retenue est très classique avec un front-office, un back-office et une zone d’échanges avec les différents fournisseurs de données. « C’est celle-ci qui présentera le plus de difficultés en raison de la diversité des formats de fichiers que nous allons récupérer : fichiers plats, EDI, bases de données SQL… », souligne Bernard Rapacchi. La problématique de l’authentification des utilisateurs est assez complexe également, car certains fournisseurs de données présents dans l’agrégateur veulent que leurs données soient consultables depuis leurs propres infrastructures. Il va donc falloir offrir la possibilité d’interroger une base de données SQL par le biais d’un VPN (réseau privé virtuel). D’autres voudront être accessibles via des services web. Quelle que soit la solution retenue, il faut mettre en adéquation les systèmes d’authentification de IODS avec ceux des fournisseurs. « Nous en avons cinq pour le moment, chacun avec un système d’authentification différent, prévient Bernard Rapacchi. Et ils sont très exigeants quant à la sécurité des données et la traçabilité de leur utilisation. »

Des technologies « open source»

Concernant les technologies utilisées, c’est le choix du logiciel libre qui s’est imposé, très répandu dans le monde universitaire et de la recherche, « et que nous maîtrisons bien pour être tranquilles concernant le suivi de projet », confirme Bernard Rapacchi. Concrètement, les technologies retenues seront PostgreSQL pour la gestion des bases de données, déjà utilisé par Eurofidai, Red Hat pour les distributions Linux, le logiciel open source Talend pour l’extraction et la transformation des données. Outre la mise au point de développements spécifiques pour l’historisation des données, comme la réécriture de la structure des données ou leur horodatage, l’expérience d’Eurofidai, traitant de forts volumes de données boursières, fera l’objet d’un transfert de compétences vers IODS. Le choix de l’hébergeur sera également crucial car les volumes de données seront importants et la bande passante nécessaire assez élevée. « Les données traitées par Eurofidai représentent désormais 6 teraoctets, en augmentation d’un teraoctet par an, précise Bernard Rapacchi. Je pense que IODS stockera un peu plus d’un teraoctet par an. »

En mai prochain, IODS sera donc opérationnelle dans quatre domaines. Les données relatives aux marchés actions et obligations (souveraines et corporate) seront fournies par Eurofidai, tandis que Telekurs, Lipper et Morningstar mettront à disposition leurs informations concernant les OPCVM, et enfin Bureau Van Dijk alimentera la partie entreprises (comptes, liens financiers, rapports annuels, communiqués…). L’idée sera d’avoir une antériorité supérieure à dix ans, ce qui est le cas pour les clients actuels de Bureau Van Dijk. Les dirigeants de IODS pensent pouvoir remonter jusqu’à vingt ans. L’OEE, de son côté, apportera quelque dizaines de milliers de séries chronologiques au niveau européen sur l’épargne, l’endettement, la gestion d’actifs avec des informations sur les sociétés de gestion, le rendement des fonds, la sous-traitance… Mais IODS s’intéresse également aux bases de données constituées spécifiquement pour une étude et qui ne sont pas entretenues par la suite. Elles pourraient être reprises et mises à jour. Des discussions sont en cours avec la Banque de France pour certaines de leurs bases de données comme celles relatives à la composition de l’actif des OPCVM, une information qui n’est pas publique car elle n’est pas obligatoire du point de vue réglementaire, contrairement aux pratiques dans certains pays européens et aux Etats-Unis. La direction de IODS se donne deux ans pour monter en puissance et, à partir de 2013, changer d’échelle et devenir européen, à la fois au niveau de l’actionnariat et des clients.

A lire aussi