La loi Pour une République numérique, adoptée définitivement en septembre 2016, prévoit une exception au droit d’auteur autorisant la fouille de textes et de données pour la recherche publique. Quel bénéfice les chercheurs peuvent-ils attendre de cette disposition, à laquelle nombre d’éditeurs français sont opposés ? Alors que les décrets d’application de la loi et les recommandations qui l’accompagnent sont en cours de rédaction et devraient être remis en janvier à Matignon, l’Association des directeurs et personnels de direction des bibliothèques universitaires et de la documentation (ADBU) publie une enquête (1) mettant en lumière les apports du text and data mining (TDM, fouille de textes en français) et pointant les nombreuses étapes restant à franchir avant sa généralisation.
L’étude, menée par le cabinet conseil britannique Research Consulting, et cofinancée par l’ADBU et le ministère de l’Education nationale, de l’Enseignement supérieur et de la Recherche, est basée sur l’analyse d’une quinzaine d’études de cas en France et en Grande-Bretagne, où une exception en faveur du TDM existe depuis 2014. Des chercheurs et des spécialistes d’universités ou de grandes institutions, telles l’université de Cambridge, l’université de Caen ou la Bibliothèque nationale de France (BNF), ont apporté leurs témoignages.
L’étude exploite également les articles consacrés au TDM, qui fournissent des chiffres surprenants. Selon cette littérature, la fouille de textes permettrait d’identifier rapidement les meilleures études dans le secteur de la santé parmi le 1,3 million de publications annuelles, une opération qui prendrait deux à trois ans si elle était réalisée manuellement et qui coûterait 100 000 euros. Le TDM pourrait également accélérer la découverte de nouveaux médicaments et réduire de douze ans leur délai de mise sur le marché.
Compétitivité
L’enjeu, selon l’étude, est la compétitivité de la France à l’échelle internationale. "L’introduction d’exceptions au droit d’auteur en faveur du TDM au Royaume-Uni et en France permet à nos chercheurs d’être sur un pied d’égalité avec l’Asie et l’Amérique du Nord, plaidait Rob Johnson, directeur de Research Consulting, lors de la présentation de l’enquête à la Bibliothèque universitaire des langues et civilisations (Bulac), à Paris, le 13 décembre. Mais l’exception n’est que la première étape. Il reste beaucoup de barrières à franchir."
Pour Rob Johnson, il est indispensable de mettre en place des infrastructures technologiques performantes, capables notamment de contourner la difficulté de la recherche dans des sources hétérogènes, aux formats non standardisés. Améliorer l’accès aux contenus est un autre paramètre essentiel. En France, le programme Istex, qui acquiert auprès des éditeurs des contenus numériques accessibles aux membres de l’enseignement supérieur et aux établissements de recherche, et la BNF pourraient jouer un rôle à l’échelle nationale. Mieux communiquer sur le TDM est un autre facteur de sa généralisation. C’est ce que compte faire l’ADBU avec cette enquête. "L’univers de la recherche est complexe à appréhender pour le grand public, les politiques, les décideurs, souligne Julien Roche, de l’ADBU. A nous de rendre le TDM compréhensible par tous, de montrer que c’est un outil qui fait gagner du temps et de l’argent."
(1) http://adbu.fr