C’est une bagarre feutrée qui se déroule en coulisse et que les lecteurs ne soupçonnent pas : les métadonnées sont devenues un enjeu économique central dans le secteur du livre. Mais que recouvre ce terme barbare ? Rien que de très banal en apparence. A savoir, le titre du livre, le nom de l’auteur, le prix, le numéro ISBN…, bref, les éléments qui permettent à tout un chacun, éditeur, bibliothécaire, libraire, d’identifier une œuvre et de la référencer. L’univers numérique impose la création de protocoles très précis qui permettent à la fois de retrouver très vite un contenu, de le mettre en relation avec d’autres et de lui garantir par ailleurs toute sa singularité.
L’importance prise par les librairies en ligne, l’explosion des réseaux sociaux, l’émergence de systèmes d’abonnement montrent bien qu’un référencement pratique, simple et efficace est la condition même de l’existence des livres, qu’ils soient sur support papier ou numérique, dans l’univers du Web.
Une véritable mine d’informations
Or, ce système de référencement, même s’il est en constante évolution, demeure encore embryonnaire en France. Certes, depuis de nombreuses années, le Cercle de la librairie est actif dans la plupart des instances internationales de normalisation (EDItEUR, ISBN, ISTC, Isni, Arrow, Thema) et assure la traduction en français de normes telles qu’Onix et Thema (1). Par ailleurs les efforts d’harmonisation menés par la Commission de liaison interprofessionnelle du livre (Clil) pour l’adoption généralisée de la classification "Thèmes Clil" facilitent le travail des éditeurs, et cela d’autant plus que la norme Onix est maintenant bien assimilée. Mais dans les faits, un certain nombre de maisons d’édition peinent toujours à renseigner correctement leurs métadonnées.
Premiers producteurs de métadonnées, les éditeurs sont souvent montrés du doigt par les destinataires de ces informations - libraires et bibliothécaires - qui leur reprochent de fournir des éléments insuffisamment détaillés. Ce n’est pourtant pas faute, pour la Clil, d’avoir publié dès 2012 un guide des bonnes pratiques à l’intention des éditeurs. Ce guide répertorie les informations "obligatoires" (titre, auteur, éditeur, collection…) et les informations "vitales" (traducteur, contributeur…) à remplir. Le président de la commission Fel Numérique de la Clil, Dominique Parisis, le rappelle : "Des métadonnées de qualité sont automatiquement mises en ligne sur tous les sites, et les moteurs de recherche trouvent plus facilement l’ouvrage concerné." Les métadonnées, véritable mine d’informations, permettent d’augmenter la visibilité du livre sur Internet, qu’il soit numérique ou imprimé. "La capacité d’un livre à être trouvé en ligne est proportionnelle à la qualité de ses métadonnées. C’est un enjeu de visibilité extrêmement fort", rappelle Virginie Clayssen, responsable de la stratégie numérique du groupe Editis et présidente de la commission numérique du Syndicat national de l’édition (SNE). La Clil a notamment amélioré sa classification en prévoyant plus de 1 000 entrées possibles (contre une centaine précédemment) et quatre niveaux de hiérarchisation. Sauf que, dans les faits, de nombreux éditeurs remplissent souvent une petite partie des champs et en laissent la majorité désespérément vides. Dominique Parisis le concède : "Thèmes Clil est utilisé, mais encore sous-utilisé."
"La production des métadonnées est un lourd travail que beaucoup, gros ou petits, n’ont pas le temps d’effectuer avec tout le sérieux que cela nécessiterait", observe Joël Faucilhon, fondateur du fournisseur de services aux éditeurs Lekti. "Actuellement, très peu d’éditeurs français sont capables de faire de l’Onix, même si Dilicom espère être prêt fin 2015 ; ces fiches sont également assez éloignées des attentes et des besoins des bibliothèques françaises", juge de son côté Ludovic Lautussier, directeur de Dawson France, fournisseur de métadonnées pour les bibliothèques. "Les métadonnées sont pénibles à récupérer, mal organisées, peu unifiées, et quand elles le sont par des opérateurs interprofessionnels, elles sont payantes et souvent chères", constate pour sa part Thomas Le Bras, chef de projet chez Leslibraires.fr, plateforme qui rassemble plus d’une centaine de librairies indépendantes. Tous les éditeurs ne sont, cependant, pas logés à la même enseigne. Les grands groupes ont mieux intégré l’importance des métadonnées et s’efforcent d’alimenter le circuit avec des notices fournies.
Chez Hachette Livre, "les métadonnées sont envoyées automatiquement vers le réseau de distribution et elles sont mises à jour après tout changement comme une nouvelle tarification ou l’obtention d’un prix littéraire, détaille Luc Audrain, responsable du support numérisation. Nous avons industrialisé le processus, ce qui permet la réception rapide de la moindre mise à jour. C’est essentiel aussi bien pour les livres papier vendus en ligne que pour les livres numériques." "Quand on produit beaucoup, il est indispensable de mettre en place un processus de production automatisé des métadonnées, renchérit Virginie Clayssen, chez Editis. C’est presque aussi important que la production du livre lui-même." "Hachette et Editis utilisent d’autant mieux Onix qu’ils ont à la fois la casquette d’éditeurs et celle de distributeurs, et qu’ils perçoivent davantage l’intérêt d’utiliser des métadonnées complètes", juge un observateur. De la même façon chez Eden Livres, la plateforme de distribution numérique développée en 2009 par Gallimard, Flammarion, La Martinière et Actes Sud, les métadonnées sont structurées "en fonction des bonnes pratiques recommandées par la Clil et relayées par Dilicom", indique Hélène Patrelle, responsable du développement numérique pour le groupe La Martinière.
Les libraires improvisent
Les libraires n’en sont pas moins confrontés à une certaine pauvreté des métadonnées qui leur sont envoyées par ailleurs. Ils adoptent alors trois sortes de comportements : soit ils importent les informations telles quelles, sans modification ; soit ils s’abonnent à la base bibliographique Electre qui leur fournit les métadonnées les plus riches (voir encadré, ci-contre) ; soit, comme Amazon, ils élaborent leur propre référencement ou, comme quelques plateformes indépendantes (Feedbook, Leslibraires.fr…), ils corrigent les métadonnées et tentent de les enrichir, souvent en inventant leur propre système de complément. "La majorité des revendeurs français exploite assez peu les métadonnées, confirme Joël Faucilhon, chez Lekti. En revanche il faut reconnaître qu’Amazon est très fin dans l’exploitation de ces fichiers." A tel point que le géant américain met à la disposition des libraires qui en font la demande un pack de métadonnées de base sur les livres papier… contre l’obligation d’afficher un lien d’achat direct vers la fiche Amazon. "Qu’en 2015 les acteurs n’aient pas réussi à s’entendre pour créer un moteur gratuit minimaliste, je ne le comprends pas", assène Thomas Le Bras. De son côté, Leslibraires.fr a notamment constitué sa propre base de données et en fait bénéficier les membres qui lui commandent un site Web. "Avant, le libraire préparait les offices avec un représentant et lisait la presse. Maintenant il s’informe sur les flux, ce serait bien s’il pouvait insérer ces flux dans son propre catalogue", imagine Bernard Strainchamps, ancien de la librairie numérique Feedbooks.
Comme la production de métadonnées reste un problème pour beaucoup d’éditeurs, un marché de prestataires s’est constitué et des sociétés, comme l’américain GiantChair, aident les éditeurs et les distributeurs à créer de bons fichiers Onix avec un logiciel de catalogage bibliographique et proposent aux maisons d’édition des solutions de repérage des erreurs qu’elles ont pu commettre en renseignant leurs métadonnées. "Nous récupérons les données issues du système interne d’un éditeur et nous les complétons pour générer un fichier complet qui est envoyé aux acteurs de la chaîne du livre", explique Christopher Saynor, chef de projet chez GiantChair. L’entreprise a aussi mis en place un système d’alertes graduées, adressées aux éditeurs en cas d’erreur ou d’omission.
Une norme internationale
Ce genre de prestations est d’autant plus recherché que Thèmes Clil intègre régulièrement lors de ses mises à jour de nouveaux thèmes, fortement inspirés par les travaux auxquels la Clil participe en vue de l’installation de la classification internationale Thema, lancée en 2012 par EDItEUR, l’organisme qui s’occupe de l’établissement et de la gestion de la norme Onix. Le Cercle de la librairie est membre du conseil d’administration d’EDItEUR.
Le code international normalisé des noms (Isni en anglais), qui permet d’identifier un auteur, est aujourd’hui peu pris en compte par les éditeurs et n’apparaît donc pas encore dans les flux Onix.
Des éditeurs de tous les pays se rencontrent deux ou trois fois par an pour faire évoluer Thema et aboutir à un système de classification standardisé au niveau planétaire. Non sans soulever quelques interrogations. "Avant d’adopter Thema en France, il faudrait déjà que Thèmes Clil soit bien maîtrisé par ceux qui indexent chez les éditeurs, estime Bernard Strainchamps. Même en bibliothèque, les gens qui font de la classification toute la journée ne maîtrisent pas tout, alors je ne suis pas sûr que Thema soit prêt à être assimilé." La commission Fel de la Clil devait terminer pour le Salon du livre de Paris un mapping officiel permettant de passer de Thèmes Clil à Thema. De plus, une nouvelle version de Thema devrait être annoncée à la Foire du livre de Londres, à la mi-avril. Au SNE, Virginie Clayssen se veut rassurante : "Nous communiquerons sur Thema auprès des éditeurs dès qu’ils auront fini leur mutation vers Thèmes Clil." Pour Bernard Strainchamps, les métadonnées produites par les éditeurs ne suffisent pas, de toute façon, et des efforts doivent aussi être faits de part et d’autre : "Les éditeurs doivent s’améliorer, c’est certain, mais si l’on ne veut pas se retrouver avec un catalogue unique, il faut aussi que les libraires enrichissent les métadonnées de leur côté, plaide-t-il. Ainsi ils montreront qu’ils apportent toujours quelque chose dans le circuit du livre numérique."
(1) Librement disponibles sur www.cercledelalibrairie.org.
Une richesse d’indexation unique
Pour le directeur général d’Electre, Philippe Beauvillard, la production et le traitement des métadonnées constituent un métier en soi.
Philippe Beauvillard - Dans la sphère de l’édition professionnelle Electre tend, pour l’imprimé et progressivement pour le numérique, à l’exhaustivité, à la plus grande exactitude dans la description de chaque ouvrage, notamment par le contrôle "livre en main", et à la plus grande réactivité (intégration des à-paraître). Elle apporte une richesse d’indexation unique, une structuration par le "modèle œuvre", et un moteur de recherche performant.
Le principal défi, dans un contexte économique qui nous conduit à orienter nos prix à la baisse, est de traiter des volumes sans cesse croissants (le numérique s’ajoutant désormais à l’imprimé) et de maintenir une avance technologique répondant aux exigences des utilisateurs.
D’où la nécessité de renforcer encore nos points forts, avec prochainement des améliorations substantielles d’ergonomie et un nouveau moteur de recherche, mais aussi d’apporter des services nouveaux à nos clients (intégration de bases disques, DVD et jeux vidéo). Services associés aux métadonnées et personnalisation sont donc des orientations majeures pour l’évolution d’Electre.com.
Il s’agit d’abord d’une prise de conscience, au-delà de celle qui naturellement existe dans les groupes importants : la mise en avant des livres, tant imprimés que numériques, ne saurait se contenter de métadonnées médiocres ou incomplètes. Or la production et le traitement de ces métadonnées constituent un métier en soi.
Les instances internationales encouragent donc les éditeurs, dans tous les pays, à se tourner vers les agences locales spécialisées dans la production et le traitement des métadonnées. C. F.