Au-delà des big data

Les big data sont à la mode. Dans les médias comme dans le débat public, le terme est évoqué de manière récurrente.

image

Des entreprises dédiées au traitement de ces masses d’informations sont créées chaque jour, d’autres réorganisent radicalement leurs activités autour de la gestion de ces données.  À la suite d’entreprises privées, les administrations de nombreux pays sont désormais dotées d’un responsable de haut rang dédié à cette thématique (la France s’est dotée en 2014 d’un Administrateur général des données). Le phénomène est tout aussi notable dans le monde académique. Des centres d’analyse de ces données massives sont créés, des postes fléchés, des revues dédiées lancées, des filières spécifiques mise en place (data science).

Dans la dernière livraison de la revueSociologie, un article co-écrit avec Julien Boelaert  revient sur cette question et sur les débats suscités par l’arrivée de ces données et les méthodes qui les accompagnent dans nos disciplines. Car débat il y a : « opportunité empirique inouïe » vs. « données pauvres » ; « révolution méthodologique » vs. « appauvrissement de la recherche » ; « surcroît de connaissances susceptible de produire une révolution scientifique » vs. « dégradation du savoir produit »… les réactions sont aussi vives que tranchées.

À partir d’une analyse des travaux de sciences sociales souvent regroupés sous ce label, on souligne que ces débats polarisés ont une chance de se poursuivre tant qu’ils se cristallisent autour de la notion de big data.Concept impressionniste, le terme désigne des réalités bien différentes selon qui l’utilise. Bien souvent, les volumes de données mobilisés ne sont même pas si massifs, surtout quand on les compare à des enquêtes classiques de la statistique publique (l’enquête Emploi de l’INSEE interroge trimestriellement 60 000 ménages sur des centaines de variables, beaucoup d’enquêtes qui se réclament des “big data” ne peuvent en dire autant).

Pire encore, à trop se focaliser sur un terme imprécis, on s’empêche de saisir le principal changement qui affecte nos disciplines, à savoir la multiplication de données numériques. Appelées ainsi parce qu’elles sont encodées avec des chiffres (1 ou 0) et qu’elles peuvent donc être lues et travaillées par des processeurs informatiques (ie. des ordinateurs), ces données numériques sont de plus en plus fréquemment disponibles. Elles peuvent être volumineuses ou pas, issues de l’internet ou pas. Elles peuvent même ne pas être numériques “nativement” (natively digital) : dans le cadre du projet sur le Parlement que nous menons en ce moment, nous avons transformé des archives papiers en fichiers numériques, afin de pouvoir automatiquement extraire de l’information sur les votes et les présences lors des premières législatures. L’Assemblée elle-même ne disposait pas de ces informations, et dès qu’elles seront nettoyées, nous les restituerons pour mise en ligne en open data.

Les big data, si on conserve ce terme dans les cas où des volumes extrêmement importants sont mobilisés et qui nécessitent des capacités de traitement particulières (high performance computing), ne sont donc que la face visible d’un phénomène bien plus large, la multiplicationexponentielle de données numériques. Il faut donc aller “au-delà des big data” pour saisir les effets que peuvent avoir ces données numériques sur les sciences sociales.

Ils sont nombreux, et l’article souligne trois aspects du travail de recherche qui sont, d’ores et déjà, transformés par cette abondance nouvelle : la question de la place et des types de statistiques qui peuvent gérer ces données; celle de l’accès et de la conservation des données; et celle des objets et de la théorisation en sciences sociales.

Étienne Ollion et Julien Boelaert
http://sociologie.revues.org/2613

Publicités

2 réflexions au sujet de « Au-delà des big data »

  1. Bonjour, je viens de tomber par hasard sur votre blog intéressant. Par contre, pourquoi n’indiquez vous pas la source de l’article que vous republiez intégralement? C’est pourtant clairement demandé sur la plateforme à laquelle vous l’empruntez. Une référence ne coûte pas cher, et elle respecte les auteurs.

    J'aime

    1. Bonjour, vous remarquerez sur les autres articles que le lien vers les sources est indiqué dès lors que je les ai. Si vous le souhaitez, je peux supprimer l’article dont vous êtes l’auteur ou indiquer sa rédaction d’origine. Cdlt

      J'aime

Les commentaires sont fermés.