Les réseaux sociaux, un enjeu majeur pour les stratégies de trading

le 27/09/2012 L'AGEFI Hebdo

Les données issues de Twitter, Facebook ou autre Youtube pourraient être intégrées dans les modèles de gestion quantitative. Une mise au point technologique s’impose.

Illustration: Patrice Alby/Agefi

Les 10 et 11 septembre derniers se déroulait à Londres « Battle of the quant », une série de conférences et séminaires dédiés à l’approche quantitative de la gestion financière. Etaient inscrits plusieurs dizaines de sociétés de gestion ou de hedge funds comme BlackRock, Credit Suisse Fund of Hedge Funds ou encore JPMorgan Alternative Asset Management. Au programme, le big data et les technologies d’analyse des sentiments, et notamment l’intervention particulièrement suivie d’un jeune Allemand, Andreas Glavan. Celui-ci a remporté en 2011 le concours « Iron trader » en réalisant une performance de 495 % sur un portefeuille fictif. Son secret ? Un programme de trading automatique basé sur l’analyse de tweets relatifs à des sociétés cotées. L’intégration de données produites sur les réseaux dits sociaux, comme Twitter, LinkedIn, Youtube ou autre Facebook, dans les flux d’informations destinés aux traders pour prendre leurs décisions d’investissement, semble intéresser de plus en plus d’établissements financiers. Rich Brown, patron de la division Elektron Analytics, déclarait d’ailleurs fin juin que de grandes banques d’investissement telles Deutsche Bank et JPMorgan menaient des projets pour intégrer des données dites non structurées (non formatées par l’appartenance à une base de données), comme des tweets ou des contenus de blogs ou de vidéos dans leur modèle d’analyse quantitative. Un enjeu suffisamment important pour que Thomson Reuters ait décidé de lancer, en mars, un fil d’informations basé sur l’analyse de plus de 4 millions de sites web dits sociaux. Selon le cabinet d’analyse Aite Group, ce sont désormais 35 % des firmes de gestion quantitative qui s’intéressent à ces technologies, contre quelques pourcents il y trois ans.

« Ce qui est intéressant, concernant Twitter par exemple, c’est le volume de données produites au sujet d’une entreprise, explique Alexandre Hajjar, cofondateur de la start-up Whale Street, créée mi-2011, dont le modèle économique est de fournir des analyses quantitatives basées sur les informations issues de réseaux sociaux. Beaucoup d’informations sont disponibles sur les entreprises via ces réseaux. Certains 'hedge funds' les utilisent pour établir des corrélations et affiner leurs avis sur telle ou telle société. » Ainsi, par exemple, une forte proportion d’employés d’une même organisation, mettant à jour leurs profils sur LinkedIn dans un même laps de temps peu avant la publication de ses résultats, constitue un signal intéressant.

Une nouvelle façon d’investir

Rob Bailey, PDG de la société anglaise d’analyse de données sociales Datasift, estime que chaque jour, 400 millions de tweets sont produits. Datasift vient d’ailleurs de lancer son offre Datasift Financial, dédiée à l’analyse en temps réel des données sociales (Facebook, Twitter…) relatives aux sociétés, dans une optique d’aide à la décision au trading. Pour ce faire, Datasift, l’un des partenaires références de Twitter avec Gnip, capables de diffuser un historique de tweets de plusieurs années, a embauché Robert Passarella, un ancien de Dow Jones. Datasift Financial collecte, entre autres, les tweets marqués du cashtag $ et les analyse. Ainsi, tous les tweets marqués comme $Alcatel auront trait à la société Alcatel. L’utilisation de ce cashtag par les partenaires de Twitter a d’ailleurs fait polémique, son invention étant revendiquée par StockTwits, plate-forme de trading social fondée en 2009.

Ces différents intermédiaires sont nécessaires à l’utilisation des données sociales dans les salles de marché, car si les volumes produits ont la taille critique pour une analyse statistique pertinente, « nombre de ces signaux peuvent être ressentis comme trop risqués pour bâtir une stratégie de 'trading' », prévient Alexandre Hajjar.

Analyse sémantique

L’histoire récente a montré les limites de cette approche. En 2010, une université américaine établissait une corrélation à 87 % entre Twitter et l’évolution, trois jours plus tard, de l’indice Dow Jones Industrial Average. La société de gestion américaine Derwent Capital Markets lançait alors un fonds basé sur l’analyse des tweets. Celui-ci fermait un mois plus tard faute de résultats probants.

Dans la même veine, Richard Peterson, un psychiatre américain, a lancé en 2008 Marketpsy Research et un hedge fund basé également sur l’analyse des tweets. Après une performance de 40 % pendant la première année, le fonds est clôturé. Mais MarketPsy Research continue à vendre son flux de données Twitter à des hedge funds. De la même façon, Derwent Capital Markets vend sa technologie d’analyse. « Dans les salles de marché, les 'traders' ont besoin d’un accès automatisé et plus facile aux données sociales, plutôt que devoir taper un nom d’entreprise par exemple », souligne Alexandre Hajjar. Il ne suffit donc pas d’intégrer des fils d’informations en provenance des réseaux sociaux dans les postes de travail des traders, mais il faut avant tout les qualifier, fiables ou pas, agréger les bonnes données entre elles et les analyser.

C’est ce qu’on appelle l’analyse des sentiments - une information est-elle favorable ou non ? - et « calculer le solde entre bonnes et mauvaises opinions ». C’est là qu'interviennent les technologies d’analyse sémantique, capables d’identifier la teneur d’un message. « Nous essayons de construire une plate-forme modulaire avec une brique destinée à produire du 'scoring' de sentiment positif ou négatif, une brique statistique destinée à établir une corrélation entre ce 'scoring' et l’évolution d’un indice, et une brique prédictive », précise Alexandre Hajjar.

De leur côté, les grands fournisseurs d’informations s’appuient aussi sur des technologies d’analyse prédictive assez sophistiquées pour crédibiliser leur offre. Ainsi, Thomson Reuters utilise Moreover Technologies, spécialisée dans la détection, l’agrégation et l’analyse sémantiques des flux d’informations non structurées. Whale Street, de son côté, développe ses propres modules selon des technologies open source. « Nous avons suscité beaucoup de scepticisme au début, mais nos premiers résultats sont encourageants », s’enthousiasme Alexandre Hajjar. Difficile de savoir si ce type de technologie est testée par les acteurs français car personne ne veut en parler. Mais l’intérêt est là. « Une société de gestion a beaucoup étudié la technologie Recorded Futur (start-up américaine proposant un moteur d’analyse d’information et comptant la CIA et Google comme investisseurs, NDLR) », affirme Yann de Saint Meleuc, directeur asset management chez Euroland Consulting. Dans un contexte où le trading quantitatif, basé sur des algorithmes toujours plus rapides, est fortement remis en question, sans compter les investissements informatiques nécessaires toujours plus importants, l’analyse des données issues des réseaux sociaux, un domaine encore peu exploité, peut représenter une piste intéressante pour les gérants. 

A lire aussi