Logo Université Laval Logo Université Laval

Volume 49, numéro 17 | 23 janvier 2014

Recherche

Où sont passées les données?

Les chercheurs sont de mauvais gardiens des données qui proviennent de leurs propres travaux

Par Jean Hamann

En théorie, les chercheurs universitaires sont censés conserver les données brutes issues de leurs travaux afin d’y référer au besoin ou de les communiquer à d’autres chercheurs qui en feraient la demande. La pratique indique toutefois que les scientifiques sont de mauvais gardiens de ce précieux patrimoine. Un article publié dans un récent numéro de Current Biology indique que le taux annuel de disparition des bases de données est de 17 % pour des études réalisées au cours des deux dernières décennies. Plus une étude date, plus grands sont les risques que les données sur laquelle elle repose soient introuvables ou irrécupérables.

L’équipe qui signe cette publication –dont fait partie Jean-Sébastien Moore, postdoctorant au Département de biologie– a tenté de communiquer avec les auteurs de 516 études publiées de 1991 à 2011 qui contiennent des données morphologiques sur les plantes ou les animaux. Dans le courriel adressé à leurs correspondants, le postdoctorant et ses collègues demandaient copie de ces données prétextant réaliser une étude similaire.

Première embûche: les adresses courriel des premiers et derniers auteurs de même que celles des auteurs attitrés à la correspondance conduisent souvent à des culs-de-sac. Même après des recherches sur Internet, le taux d’attrition des courriels valides atteint 7% par année.

Les chercheurs sont tout de même parvenus à communiquer avec 74% des signataires des études. Dix-neuf pour cent des scientifiques joints leur ont transmis les données brutes demandées et un autre 4% a refusé parce que les données étaient encore exploitées. Tous comptes faits, seulement 23% des données étaient recouvrables. Le reste était soit perdu, soit stocké sur des supports informatiques maintenant illisibles.

Jean-Sébastien Moore reconnaît que fouiller dans ses archives et tenter de récupérer des fichiers stockés sur des supports informatiques obsolètes exige un effort qui a pu rebuter plusieurs de leurs correspondants. «Une forme de récompense – comme la possibilité de cosigner l’article que nous disions préparer – aurait pu en inciter davantage à déployer les efforts nécessaires pour recouvrer leurs données», estime le postdoctorant.

Reste qu’une forte proportion des bases de données est tout bonnement disparue et que la communauté scientifique ne pourra jamais en tirer parti.

Il existe pourtant une solution simple à ce problème, avancent Jean-Sébastien Moore et ses collègues. Il suffirait de demander aux auteurs d’une publication de déposer dans un site d’archivage public les données brutes sur lesquelles repose leur étude. Certaines revues scientifiques, notamment Molecular Ecology, Evolution, Journal of Evolutionary Biology et Heredity ont déjà adopté cette pratique. «Nous espérons que le problème que nous avons mis en lumière ici incitera les autres publications à emboîter le pas rapidement», concluent-ils.

Jean Hamann

Seulement 23% des données sur lesquelles reposent les 516 études publiées entre 1991 et 2011 étaient recouvrables. Le reste était soit perdu, soit stocké sur des supports informatiques maintenant illisibles.

Photo: Jean Hamann

Écrivez-nous
Partagez