Saturday, March 21, 2015

Interopérabilité des livres électroniques

Doesn’t mean what you think it means 1

Ces jours-ci, j’ai eu plusieurs fois l’occasion de voir, lire des articles, ou discuter autour de l’interopérabilité des ebooks. Une constante revient souvent : “Mais Amazon a son propre format à lui, fermé et non interopérable, alors que l’EPUB est un format interopérable en lui-même”. Il m’est arrivé de le penser, de le dire, mais comme d’habitude, la vérité est un peu plus compliquée que ça.

L’EPUB

Déjà, prenons pour exemple cet EPUB présenté en idéal de l’interopérabilité. Déjà, et sans vouloir être trop technique, l’EPUB est un standard (dans plusieurs versions) normalisé par l’IDPF, une organisation regroupant plusieurs industriels ayant des intérêts au livre électronique.

Ce standard définit comment rassembler dans un fichier unique (le fichier EPUB) un ensemble d'autres fichiers “ressource” qui le constituent.

Ces fichiers ressource (dans des formats le plus souvent compatibles “web”) peuvent contenir

  • du texte (au format (X)HTML)
  • une image
  • une feuilles de styles
  • des fontes ou autres…
  • des métadonnées et informations complémentaires explicitant/liant le tout (table de sommaire par exemple).

À peu de choses près, on peut dire que ça correspond à un site web qu’on aurait encapsulé/archivé dans une “boite” fichier unique.

Yo ho ho

Et puisqu’on peut dire que c’est un site web, on se dit évidemment qu’afficher un livre en EPUB, c’est aussi simple qu’afficher un site web, donc l’affaire est entendue.

Mais outre le fait que ce ne soit déjà pas “aussi simple” qu’afficher un site web, il est intéressant de se rappeler l’histoire du Web. Et alors que la marque “Internet Explorer” est sur le point de rendre l’âme, on se souviendra avec émotion les guerres inter-navigateurs des années 2000, et les sites incompatibles. Et bien pour l’EPUB, on se retrouve exactement dans la même situation, avec différents “navigateurs de sites EPUB” (moteurs de rendus d’EPUB) qui n’affichent qu’imparfaitement ces fichiers pourtant “normalisés”.

Le problème est d’autant plus important sur les liseuses dont le moteur de rendu n’est mis à jour que rarement.

Alors certes, les fichiers sont souvent au moins partiellement lisibles sur les plateformes “EPUB” différentes de celles sur lesquelles elles ont été testées, mais de là à pavoiser sur un format “interopérable”, il est peut-être plus prudent de s’abstenir.

Mais c’est quand même mieux que pas interopérable du tout, non ?

En fait, il y a des cas où… non, pas du tout.

Prenez par exemple un ebook d’un grand éditeur acheté chez Apple. C’est un EPUB, vous le savez, c’est donc interopérable, vous pourrez donc le lire sur votre liseuse… Eh bien non.

Car si le format est interopérable, le contenu a été transformé pour que seules vos installations de lecture Apple puissent les lire, et selon des règles que ces installations imposent. Et il n’y a pas d’installation possible de logiciel de lecture pour votre liseuse.

Cette transformation du contenu, vendue aux auteurs et éditeurs sous le nom de DRM (Digital Right Management), est supposée permettre de lutter contre les copies illicites (contrefaçon). Elle fonctionne grosso modo de la manière suivante :

Une clef de chiffrement est choisie. Elle est utilisée pour chiffrer plusieurs des ressources à l’intérieur du fichier EPUB, on modifie également les fichiers de métadonnées pour préciser comment l’opération a été faite.

Coffre-fort HT15 Hartmann

Si l’on s’arrête là, le fichier est illisible par le client à qui il a été vendu, il est donc nécessaire de s’assurer qu’il aura la clef pour y accéder. Cette transmission se fait le plus souvent “sous le manteau”, de manière cachée, mais au bout du compte, le client possède le fichier EPUB (avec les ressources chiffrées et les indications pour déchiffrer), et évidemment la clef.

C’est d’ailleurs là qu’on se rend compte d’une des limites du système : le client a tout ce qu’il faut pour déchiffrer ce qu’on ne veut pas qu’il déchiffre, tout en voulant qu’il déchiffre quand même…

Dans le cas de l’ebook acheté chez Apple, le format est certes interopérable (avec les réserves relevées sur le fichier en lui même), mais le chiffrement et la méthode d’accès à la clef et de (dé)chiffrement ne le sont pas. L’ebook chiffré en lui même ne peut donc pas prétendre à une quelconque interopérabilité.

On n’est pas des pommes.

Ah, mais je ne parlais jusqu’ici que d’ebooks issus d’un écosystème fermé, celui d’Apple ! On peut regarder plutôt chez des libraires bien de chez nous, Decitre, Chapitre, leslibraires.fr, feedbooks ou autre…

Et bien, si l’on parle de fichiers sous DRM (la quasi totalité du catalogue des groupes majeurs d’édition), ils sont disponibles chez ces libraires avec des DRM Adobe. Alors, certes, la plupart des solutions de lectures sont compatibles des DRM Adobe, mais on n’est toujours pas interopérable. Prenez par exemple des clients avec des machines sous Linux. Et bien ils ne peuvent pas lire ces ebooks.

On est interopérable ou on ne l’est pas. En l’occurrence, là ça ne l’est pas.

L’IDPF planche semble-t-il, sur une solution de DRM “Lightweight” (LCP : Lightweight Content Protection), censée être interopérable. Les détails techniques de cette solution seraient disponibles, et diffusés, mais dans un cadre restreint ? À condition de signer un accord de confidentialité ? Sans vraies informations depuis que les travaux ont démarré, je ne peux que m’abstenir de commenter. Outre les détails techniques du système en lui-même, et même si se débarrasser de l’influence d’Adobe dans le domaine serait un progrès, reste qu’il sera quasi impossible de mettre à jour les liseuses des lecteurs équipés, l’interopérabilité restera donc problématique.

Le vrai problème de l’interopérabilité

Mais qu’on arrête de se voiler la face, parmi les défenseurs de l’interopérabilité, deux camps se distinguent : celui des usagers (lecteurs, bibliothécaires/conservateurs etc.) et celui des ayant-droits (éditeurs, associations d’auteurs, politiques de tout bord etc.).

Si les premiers réclament une interopérabilité effective, les seconds ce qui les intéresse en tout premier chef c’est… de contrer les gros écosystèmes anglophones, les “AGAK” (Amazon, Google, Apple, Kobo), et Amazon le premier. Amazon, ce grand épouvantail de la librairie, cet antéchrist de la chaîne du livre, qui a l’outrecuidance d’imposer son propre format propriétaire donc non-interopérable.

Boats at Amazon River

Bon, Amazon c’est certes un gros méchant qui optimise fiscalement tout ce qu’il peut. C’est certes un gros méchant qui écrase la concurrence en rasant les prix et impose des conditions de travail quasi inacceptables. Mais là ça dépasse les bornes ! Amazon utilise un format propriétaire non interopérable !

Bof.

Bof, bof.

Vous voulez que je vous dise ce que j’en pense ? Cette histoire d’interopérabilité c’est du flan. La preuve, leur format propriétaire là, ça fait belle lurette qu’il a été dé-propriétarisé. La preuve ? (bis) Le logiciel Calibre (gratuit et sous licence libre) lit les ebooks “Kindle” sans soucis, sans utiliser une ligne de code venant d’Amazon. Pas parfaitement, mais pas franchement plus imparfaitement que certaines solutions de lectures EPUB avec des fichiers EPUB “normaux”. Et non seulement il les lit, mais il est capable de convertir des fichiers Kindle en fichier EPUB et réciproquement.

Il faut dire qu’un “site web” encapsulé dans un fichier EPUB ou un “site web” encapsulé dans une base de données, ça reste composé à peu près de la même manière : des fichiers (X)HTML, des ressources graphiques ou autre, des fontes, des métadonées etc.

Alors les outils de conversions (comme Calibre dont je parlais plus haut) n’ont qu’à ouvrir la capsule, en extraire les ressources, les manipuler un peu et les réintégrer dans une nouvelle capsule pour aboutir au fichier dans le format voulu.

Et puis si on perd un peu de mise en page au passage, “un livre est un livre” , c’est le texte qui compte, et croyez-moi ou pas, le texte résiste plutôt bien à la transformation.

Mais si ça convertit, il est où le problème ?

Justement, il n’y en a pas… ou plutôt, il n’y en aurait pas s’il n’y avait pas de DRM. Quel que soit l’e-libraire, s’il met des DRM (à la demande le plus souvent de l’éditeur), la conversion est impossible, que ce soit dans un sens ou dans l’autre.

Impossible car le contenu des fichiers “ressource” est chiffré et donc illisible par le logiciel de conversion.

Impossible de convertir des fichiers chiffrés… Impossible sans la clef… que l’on a puisqu’on en a besoin pour lire l’ebook… que des petits malins savent où aller chercher la où elle est cachée et nous la donner… des petits malins qui ont écrit légalement des programmes pour aller chercher cette clef et l’utiliser pour déverrouiller l’ebook… qui sont interdits en France.

Bon. Si on ne se pose pas de question de légalité (ou si c’est légal chez vous), autant le dire, l’interopérabilité n’est pas un problème insurmontable : on s’assure d’avoir une solution légale – et configurée correctement – de lecture conforme aux besoins des logiciels en question, on installe le logiciel, on lui passe le fichier et il en ressort tout “interopérable-ready”. Un coup de moulinette Calibre et zioup, vous avez votre fichier en sortie.

L’interopérabilité ? “No soucy”, comme le dit ma pote Ophely.

Mais bon, en France (en Europe ?), on a quand même ce petit souci de légalité quand même : depuis le vote de la loi DADVSI (coucou les copains HADOPI!), la légalité du déchiffrement est au moins douteuse, et donc l’interopérabilité l’est.

Il y a bien une solution quand même ?!

Oui, il y en a.

On pourait déjà supprimer la sur-protection légale du DRM (vous savez, cette interdiction artificielle de passer outre un verrou trop faible pour se protéger lui-même…). Ou en publier les spécifications et les clefs, comme le préconise Julia Reda, mais bon, “elle veut détruire le droit d’auteurs, alors on rejette en bloc toutes ses propositions”.

Autrement, n’en déplaise à certains amis auteurs, éditeurs, ayant-droits et affiliés (Coucou les copains 3l3ctr0n ! ) la solution c’est de se passer de DRM.

De se passer par exemple purement et simplement de tout type de protection. C’est le choix – le meilleur à mon avis – qu’ont fait les éditeurs américains Baen et Tor par exemple, des éditeurs “classiques”, qui publient sans aucune protection les versions numériques de leurs livres papier, et sans que cela ait nuit à leurs ventes.

Zank wodny pl1

Mais sans aller aussi loin, ni géographiquement ni conceptuellement, une solution intermédiaire existe. Il s’agit de la solution du Watermark/Filigranne. Cette solution consiste en l’ajout masqué et/ou visible d’informations attribuant l’exemplaire à l’acquéreur, et ne présente aucun des soucis d’interopérabilité. Et si le nombre d’éditeurs qui adoptent ce type de protection est en augmentation 2 3, je n’ai pas lu/vu d’éditeur se retourner vers les DRM après avoir fait ce choix. Cette solution n’est certes pas parfaite non plus, mais d’un point de vue interopérabilité, elle n’est pas obstacle aux conversions/corrections.

Alors que la très grande majorité (totalité ?) des e-libraires français (et je pense européens) supporte cette solution de filigranne, les e-libraires nord-américains (Amazon, Google, Apple, Kobo – et Fnac par extension– ) ne le font pas, et remplacent les demandes de watermark par du DRM. S’il y a un reproche à leur faire sur l’interopérabilité, c’est plutôt celle là, mais je n’entend pas les représentants des éditeurs, des distributeurs ou des auteurs s’en préoccuper.

Bref

Bref, chers amis qui réclamez de l’interopérabilité, vous savez ce qui vous reste à faire : convaincre l’ensemble de la chaîne du livre de se passer de ces verrous qui brident l’interop. A défaut, arrêtez de jouer les hypocrites en utilisant l’interopérabilité comme système de guidage ou de nuage de fumée pour vos attaques anti GAFA(K).

Les sujets sont nombreux pour s’en prendre à ces grands groupes nord-américains en quasi-monopole : abus de position dominante, optimisation (fraude ?) fiscale, conditions de travail indignes ou abusives, externalisations.

Outre le fait que les GAFA n’ont pas le monopole de ces pratiques (regardons le groupe Lagardère/Hachette, exemplaire j’imagine…), le public vous emboitera le pas sur ces sujets tout comme il vous suivra sur ceux de la liberté d’expression et des censures morales américano-centrées, des Conditions Générales d’Usages discretionnaires ou abusives et de tant d’autres.

Mais mettre sur le dos des e-libraires des problèmes d’interopérabilité de son propre fait qu’on empire en les consacrant légalement, c’est tout simplement n’importe quoi.


MAJ 26/03/2015 : Il y a une erreur dans mon texte, que je me dois de signaler : les ebooks achetés chez Apple n'ont pas tous de DRM, qui ne seraient positionnés qu'à la demande des éditeurs (soit demande explicite de chiffrement, soit demande de Watermark). N'ayant pas de matériel Apple pour comparer, et les DRM n'étant pas (contrairement à la législation française) signalés, je ne peux pas le vérifier. Ca ne contredit en rien les problèmes liés à ces DRM sur le format "interopérable" EPUB en présence de DRM.


  1. Bon point au premier qui saura. Je sais, c’est facile…

  2. merci à l’Atalante, Bragelonne, Diable Vauvert, Editions de Minuit, Robert Laffont pour n’en citer que quelques-uns

  3. Merci aussi à la plupart des éditeurs Pure-Players, Walrus, Numeriklivres, Publie-Net, et tous les autres…