Technologies : Le « Big Data » et « Data Mining » à l’ère de la finance

Dignes héritiers de l’analyse de données et des statistiques exploratoires, le « Big Data » et le « Data Mining » sont des champs d’étude au croisement de la statistique et des technologies de l’information.

image

Quelle différence fait-on entre ces deux termes ? Historiquement, le Data Mining existait sans le Big Data, mais ce dernier existe obligatoirement avec le premier. En effet, Le Big Data est avant tout la recherche du stockage des données et la manière d’arriver à y accéder rapidement. Le Data Mining s’attachera plutôt à l’exploration et l’interrogation de données structurées à forte valeur ajoutée. Autrement dit, on va extraire des « pépites » dissimulées dans des « montagnes de données ».

Le « Big Data » couplé au « Data Mining » va permettre d’accumuler une volumétrie de données conséquentes. Le processus d’extraction des données consiste ainsi à exploiter ces dernières en appliquant des algorithmes d’analyses par des règles d’association, segmentation des données, arbres de décision, corrélation entre attributs, indices de pertinence, classification, scoring (construction d’une note de risque, combinaison des prédicateurs).

Les sociétés peuvent soit collecter les données et les mettre à disposition, c’est-à-dire des « sociétés infrastructures », d’autres vont éditer des logiciels et permettent leur étude « sociétés d’analytics » enfin la troisième typologie d’entreprises regroupe les sociétés non technologiques ayant intégré l’utilisation du Big Data dans leur activité principale afin d’en tirer un avantage compétitif, on parlera de « sociétés data users ».

Application concrète dans notre quotidien

A titre d’exemple, la société américaine Walmart traite plus d’un million de transactions client par heure, ces dernières sont importées et conservées dans des bases de données numériques. De même, Facebook traite 50 milliards de photos qui sont stockées, traitées et analysées.

Aujourd’hui, selon l’International Data Corporation (IDC), seules 0.5% des données générées dans le monde sont analysées. Le potentiel de croissance est encore très nettement sous exploité avec des données numériques qui devraient atteindre 35.000 exaoctets (un exaoctet valant un milliard de gigaoctets) en 2020, soit 20x plus qu’en 2010.

Essence même des réseaux sociaux (Facebook, Twitter), moteurs de recherches (Google, Yahoo), ou encore sites de ventes en lignes (Amazon), le recours au « Big Data » et « Data Mining » permet d’enregistrer, de cibler et profiler les utilisateurs par la multitude de traces numériques et données laissées en surfant. Le but est de leur fournir un contenu entièrement personnalisé, des suggestions, du démarchage en fonction des pages consultées, des achats effectués, des mots clés les plus tapés. Un véritable marché qui fait ses preuves et attirent de nouveaux acteurs que ce soient les sites de rencontres ou les banques. Ces dernières sont en effet désormais capables de proposer des forfaits téléphoniques, et bientôt même des véhicules en fonction des consommations, achats, dépenses faites sur leurs comptes par les clients.

Cette exploitation de statistiques à grande échelle est rendue possible aujourd’hui par la puissance des processeurs, des serveurs de stockage de plus en plus conséquent ou encore l’augmentation du débit pour le transfert des données. De véritables « Data Warehouse » ont fait leur apparition ces dernières années, constituées de parcs de serveurs recueillant des térabytes de données automatiquement. A titre d’exemple, le géant de l’informatique Dell, vient d’opérer un virage à 180 degrés l’année dernière en délaissant le marché déclinant des PC pour se consacrer quasi exclusivement au Big Data par le rachat de la société EMC, poids lourd du stockage de données informatiques pour la somme record de 67 milliards de dollars.

De nombreuses sociétés se sont spécialisées dans ce domaine, à tel point qu’un indice de référence ISE Big Data ETF a été créé et regroupe les acteurs majeurs de ce secteur. Peuvent ainsi être citées : Tableau Software Inc, Fair Isaac Corp, Splunk Inc, Marketo Inc, de jeunes sociétés de quelques milliards de dollars de capitalisation. Il en est de même pour des géants comme IBM, Dell, Cisco ou encore Microsoft qui affichent leurs ambitions en matière d’analyse de données. On estime que le secteur de la santé devrait largement profiter dans l’avenir de la montée en puissance du « Big Data », avec l’émergence d’une médecine personnalisée. Enfin, des fonds d’investissements se sont lancés dans l’aventure de cette évolution technologique et sociétale majeure comme le fonds Edmond de Rotschild Fund Global Data.

D’une application marketing à une application financière

Si la technologie d’aujourd’hui permet ce traitement des données comportementales des personnes physiques, pourquoi ne pourrait-il pas en être de même pour le traitement des données des personnes morales ?

Sur ce modèle la société Surperformance éditrice du site ZoneBourse.com et 4traders.com fait office de précurseur en la matière, puisque premier site financier francophone recourant à la technologie du Big Data Mining pour le traitement de ses données boursières. L’intérêt est double :

–          Grâce à l’emploi de plusieurs serveurs de stockage pour la collecte en temps réel de données financières des sociétés cotées, ZoneBourse exploite cette base de données lui permettant par des algorithmes complexes de faire ressortir des classifications et notations de société (voir ci-dessous) pour l’élaboration de ses stratégies publiées et dans l’optique d’appliquer un money management et un Stock picking à ses portefeuilles réels. 

–          Offrir à ses lecteurs et abonnés, la mise à disposition d’un moteur de recherche « Market Screener » permettant à tout un chacun de rechercher dans la base de données les informations financières (croissance, PER, révision, gouvernance, secteur d’activité…) de plus de 30.000 sociétés de tous pays. L’étude et l’exploitation de ce contenu étant entièrement personnalisables et sélectives.

La société Surperformance, en partenariat avec Commerzbank, deuxième groupe bancaire allemand, vient d’ailleurs de lancer le premier fonds d’investissement exclusivement basé sur la technologie « Big Data Mining ». Un fonds composé à plus de 75% de sociétés européennes de type « Value » (sociétés faiblement valorisées), « yield » sociétés de rendement) et « growth » société de croissance. Vous pouvez retrouver plus de renseignements sur la page suivante
http://www.zonebourse.com/services/fonds_europa_one/

Par Sébastien Gatel
http://m.zonebourse.com/actualite-bourse/Technologies-Le-Big-Data-et-Data-Mining-a-l-ere-de-la-finance–21654384/

Publicités