Open data oui, mais pas d’aspiration de données

Une décision de justice affirme que le droit du producteur de bases de données prévaut au droit à la réutilisation des archives publiques. Un document public doit être simplement scanné et mis à disposition pour être rendu public. Et peu importe la qualité du scan.Jusqu’où peut-on aller pour récolter des données publiques en France ? La société NotreFamille.com, qui édite le site internet genealogie.com, souhaitait que ces données puissent être « aspirées » à partir du site internet du département de la Vienne.

Mais pour ce faire, encore faut-il que le producteur de la base de données l’y autorise. Cette problématique va donc bien au-delà de la mise à disposition sur le Web d’un scan de page de registre d’état civil. C’est pourtant la formule choisie par les Archives Départementales de la Vienne, qui présente sur un site dédié de nombreux documents administratifs scannés.

Pas simple d’utiliser ce genre de données, même si elles sont ‘numérisées’. (Crédit : Conseil Général de la Vienne)

Face à l’impossibilité d’aspirer les archives dans leur entièreté, NotreFamille.com avait demandé au tribunal administratif d’abroger la délibération fixant les conditions d’accès à la base de données.

Un arrêt rendu le 26 février dernier par la Cour administrative d’appel de Bordeaux lui a donné tort, considérant que le droit du producteur de bases de données prévaut au droit à la réutilisation des archives publiques.

« Ils exigeaient que l’on effectue un travail de reformatage des données sur le cadastre napoléonien et les registres d’Etat Civil, pour leur propre usage » explique Véronique Nocquet, de la direction juridique du Conseil Général de la Vienne, à propos de l’affaire NotreFamille.com.

La vague de l’open data touche l’ensemble des administrations françaises. Certains en font un cheval de bataille, tel Etalab, proposant des jeux de données publiques dans des formats divers et variés, souvent exploitables rapidement.Sauf que la loi qui encadre la mise à disposition des données publiques (articles 4 et 10 de la loi du 17 juillet 1978), ne précise pas le format avec lequel doit s’effectuer cette tâche.

Pour faire court, si pour une raison X ou Y une administration souhaite peu communiquer sur des données qu’elle a créé ou récolté, il lui suffit de proposer un scan de document papier au public. Bonne chance à qui voudra recenser et compiler les données ! Dans la cas des archives du Conseil Général de la Vienne, il ne s’agit pas de cette problématique, mais bel et bien de la finesse du travail de numérisation de documents papiers, parfois vieux de plusieurs siècles.

« Ils voulaient que l’on fasse le travail à leur place » se justifie Véronique Nocquet, estimant déjà le coût de la mise en ligne des données ‘brutes’ à plus de 200 000€.

Il aurait alors fallu que la collectivité utilise un logiciel d’OCR (ou ROC pour Reconnaissance Optique de Caractères) pour que les noms de famille, nom de lieux, ou encore dates de naissance des registres soient exploitables directement, …par un service web de généalogie par exemple.

Par Guillaume Serries

Publicités