Il n'existe pas de label IA identifié, mais selon plusieurs professionnels du milieu, des milliers de livres audio conçus à partir d'une banque de données vocales circulent déjà sur le marché.
Parmi les plus en pointe, DeepZen propose un tarif d'entrée qui peut diviser, au minimum, par quatre le coût de conception d'un livre audio par rapport à un projet classique. Cette petite société basée à Londres puise dans une base qu'elle a créée en enregistrant les voix de plusieurs acteurs, à qui l'on a demandé d'exprimer un registre d'émotions différentes.
« Zone grise »
« Nous avons signé un accord de licence avec toutes les voix que nous utilisons, indique Kamis Taylan, directeur général de DeepZen. Nous payons pour les enregistrements, (...) et nous versons des royalties à chaque fois que nous utilisons la voix pour un projet. »
La start-up texane Speechki propose, outre le recours à ses propres enregistrements, de se servir de voix tirées de banques de données existantes, selon le directeur général Dima Abramov. « Cette seconde option passe par la signature d'un contrat qui comprend les droits d'utilisation », précise-t-il. Et les narrateurs ne voient pas ces nouvelles pratiques d’un bon œil.
Tanya Eby pose sa voix sur des textes depuis vingt ans, à temps plein. En six mois, le carnet de commandes de cette américaine a fondu de moitié et beaucoup de ses collègues ont également vu leur activité ralentir. « Les choses évoluent tellement vite qu'il y a beaucoup de nouveaux venus qui se servent de voix sans rémunérer leurs auteurs », alerte-elle. « Il y a une zone grise, exploitée par de nombreuses plateformes, abonde Kamis Taylan. Ils prennent votre voix, la mienne, et cinq autres, ils créent une nouvelle voix et ils ne payent rien, en disant que cela n'appartient à personne. »
Séduire les indépendants et petits éditeurs
Selon des professionnels interrogés par l'AFP, plusieurs noms de l'édition traditionnelle recourent déjà à l'IA dite générative, c'est-à-dire capable de créer, sans intervention humaine, textes, images, vidéos ou voix, à partir de contenus existants.
« La narration professionnelle a toujours été essentielle à l'écoute sur Audible et le restera, a indiqué une porte-parole du géant américain des livres audio, filiale d'Amazon. « Cela dit, avec l'amélioration de la technologie, nous imaginons un avenir dans lequel l'interprétation humaine et le contenu généré (avec l'AI) pourront co-exister. » Très investis dans l'intelligence artificielle, les géants technologiques sont impliqués dans l'économie bourgeonnante des livres audio générés par logiciel.
En début d'année, Apple a lancé une offre de « narration numérique » destinée, selon la firme à la pomme, à « rendre la création de livres audio plus accessible à tous », notamment « aux auteurs, indépendants et petits éditeurs ». Google propose un service similaire, décrit comme de l'« auto-narration ». « Nous devons démocratiser l'industrie de l'édition, parce que, en l'état, seuls les noms les plus connus sont convertis en livres audio », décrit Kamis Taylan.
« La narration synthétique ouvre la porte à tous les livres existants qui n'ont pas été enregistrés et à tous ceux à venir qui n'auraient jamais été convertis à cause des contraintes économiques », selon Dima Abramov, qui estime à 5 % actuellement le nombre de livres qui deviennent des audiobooks. Pour Tanya Eby, en l'état, la narration IA « manque de lien émotionnel. Il y a une vraie différence (avec les enregistrements classiques, ndlr). Mais avec le temps, les auditeurs vont peut-être s'y habituer. J'aimerais quand même que les producteurs indiquent clairement aux utilisateurs qu'ils écoutent un produit généré par l'IA, qu'ils soient francs », conclut-elle.