Sites


Créer un Epub

Introduction

L'EPUB (acronyme de « electronic publication » ou « publication électronique ») est un format standardisé pour les fichiers de livres numériques. Il s'appuie notamment sur le HTML, le langage de balisage utilisé pour créer des sites web.

Un livre au format EPUB est composé de plusieurs dossiers et fichiers réunis dans un conteneur qui porte l'extension .epub. Il contient du texte (fichiers HTML), des images (fichiers .jpg, .png ou .svg), des feuilles de style (fichiers CSS) ainsi que des fichiers décrivant la structure du livre et ses métadonnées (l'ensemble des informations – auteur, titre, date de publication, ISBN... – permettant le bon référencement bibliographique de l'ouvrage).

Pour éviter les confusions, nous écrivons EPUB pour désigner le format et epub quand il s'agit d'un fichier ainsi que pour le format PDF.

Qui a créé l'epub ?

L'EPUB a été développé par l’IDPF (International Digital Publishing Forum), une organisation à but non lucratif dont le but est de favoriser l'accessibilité des publications numériques en promouvant la création de standards ouverts.

Elle regroupe aujourd’hui plus de 200 acteurs internationaux du logiciel, d'Internet et de l'édition parmi lesquels des distributeurs, des éditeurs, des librairies et des bibliothèques. L'Association nationale des éditeurs de livres au Canada, le SNE (Syndicat national de l'édition) en France, le groupe d'édition Hachette Livre, ou encore la chaîne de librairie américaine Barnes & Noble en font notamment partie.

L’IDPF commence ses activités en 1999 avec la création de l’OEB (ou Open eBook) permettant aux éditeurs de disposer d’un premier format standardisé dédié à la lecture numérique, accepté par un grand nombre de dispositifs de lecture.

En 2007, L'EPUB 2 remplace l’OEB et devient officiellement le nouveau format standard pour les fichiers de livres numériques. L'EPUB (comme l’OEB) est un format dynamique qui s'adapte à tous les supports de lecture en ajustant l'affichage à la taille de l'écran.

La dernière version, L'EPUB 3, a été présentée officiellement en octobre 2011 lors du Salon du livre de Francfort.

Par rapport à la version précédente, epub 3 permet notamment :

  • d'enrichir votre livre numérique avec des documents multimédias (fichiers audio et vidéo) ;
  • de mieux intégrer des équations mathématiques grâce au support du format MathML ;
  • de mieux intégrer les langues n'utilisant pas l'alphabet latin (notamment les langues avec sens de lecture vertical) ;
  • d'opter pour une mise en page fixe (fixed layout) qui empêche le redimensionnement du contenu et permet donc de conserver la mise en page d'origine. Cette dernière caractéristique facilite notamment la réalisation de livres numériques riches en illustrations.

Cette norme revêt une telle importance que plusieurs associations professionnelles d'éditeurs de différents pays ont décidé de devenir membres de l'IDPF afin de prendre une part plus active dans le développement de ce format. C'est le cas notamment du Syndicat national de l'édition (SNE) en France qui a mis en place au sein de son association un groupe de travail consacré aux « Normes et Standards  » dans le numérique (http://www.sne.fr/dossiers-et-enjeux/numerique/normes-et-standards.html).

Le livre électronique : EPUB ou PDF ?

Le PDF est un autre format standard, sur lequel repose encore actuellement la plus grande partie de la production et de la commercialisation de livres.

L'EPUB et le PDF reposent sur des logiques tout à fait différentes. Le PDF suit une logique visuelle, correspondant à la page papier. Il a initialement été pensé pour échanger des fichiers tout en préservant la mise en forme d'origine et sert aujourd'hui de base à l'impression. L'EPUB est au contraire à l'origine une forme de publication en flux, s'adaptant visuellement et fonctionnellement à son support de lecture : taille de l'écran, capacités d'interaction, etc.

Cette « fluidité » du format epub a été un frein au passage de nombreux éditeurs à l'édition électronique. Le format est pourtant aujourd'hui largement accepté et recommandé du fait des changements d'outils et d'usages de lecture. À l'instar du HTML utilisé pour les sites web, les contenus d'un livre epub se présentent en un flux recomposable qui s'adapte aux différents écrans, lesquels vont du smartphone aux tablettes en passant par toutes les tailles d'ordinateurs. Cette particularité, qui bouscule pourtant fortement la tradition éditoriale, répond très bien à ces nouveaux usages mobiles.

Une nécessaire adaptation de la chaîne de fabrication

La chaîne de fabrication traditionnelle d'un livre consiste à importer un fichier bureautique (texte et images) issu d'un logiciel de traitement de texte dans un logiciel de mise en page (Scribus, InDesign, QuarkXpress, PageMaker, Publisher etc.) pour produire un fichier pdf destiné à l'impression. Le fonds des éditeurs est ainsi principalement constitué de fichiers pdf. C'est donc à partir de ceux-ci que sont la plupart du temps produits les fichiers epub.

Or, si le PDF et l'EPUB n'ont pas du tout la même logique, ils n'ont pas non plus les mêmes soubassements techniques. Le code du fichier epub spécifie la fonction de chaque élément dans le texte (titre, paragraphe, élément d'une liste, citation...) pour leur associer ensuite une façon de s'afficher ou de se comporter. Rien dans un fichier pdf n'indique le rôle que jouent les éléments de contenu, autrement que par leur apparence : on « voit » que tel titre est un titre de chapitre car il est graphiquement distinct des autres. Malheureusement, contrairement à un humain qui sait implicitement distinguer un titre de chapitre du reste du texte par sa simple différence graphique, aucun logiciel ne « voit » cela par lui-même.

Dans la conversion du pdf vers l'epub, il faut donc redonner à chaque élément du texte sa fonction. Cela peut se faire en associant aux données géométriques de la maquette une structure fonctionnelle. Mais peu de logiciels permettent de le faire de manière satisfaisante et il reste indispensable de procéder à une validation humaine page à page du résultat. Dans la plupart des cas, nous récupérons un texte brut sans aucune distinction. Tout le travail de structuration est alors à refaire.

Il faut ajouter à cela qu'un pdf peut réserver quelques surprises. Peu importe la manière dont a été géré le contenu tant qu'il apparaît « comme il faut ». Ainsi, un texte visuellement linéaire peut en fait ne pas l'être et apparaître déstructuré lorsqu'on le copie. Des contenus invisibles, camouflés dans un bloc de texte mis en blanc, réapparaîtront au milieu du texte récupéré. Les cas de déstructuration sont nombreux : notes de bas de page réparties sur deux pages, césures de fin de ligne, éléments des cellules d'un tableau éparpillés, etc.

Quelle que soit la qualité du fichier pdf considéré, et malgré le développement d'outils de récupération automatique de plus en plus performants, le PDF est donc un format peu approprié pour servir de point de départ à un processus d'édition epub. S'il est incontournable lorsqu'il s'agit de traiter le fonds ancien, il est donc recommandé aux éditeurs de mettre en place dès aujourd'hui des processus de fabrication qui permettront à l'avenir de produire les pdf et les epub en parallèle et non plus successivement.

C'est pourquoi nous verrons ici comment fabriquer un epub à partir d'un pdf mais aussi en partant d'une source texte (OpenOffice, LibreOffice, MS Word...), du logiciel de mise en page ou en rédigeant directement dans un éditeur epub. À vous d'évaluer chacune de ces méthodes et de voir de quelle manière elle s'insère dans votre chaîne de fabrication papier, le cas échéant.

Un format ouvert

L’epub a la particularité d’être un format libre et ouvert contrairement à d’autres formats, dits propriétaires, qui reprennent une technologie similaire. Citons ainsi le MoBi et son successeur le KF8, formats propriétaires créés ou repris par Amazon.

Un format ouvert est accessible à tous. Ses normes techniques sont connues et documentées et on peut accéder sans barrière au code du fichier. Cette particularité permet aux créateurs d'epub de modifier et contrôler leurs fichiers comme ils l'entendent et aux informaticiens de développer des applications de lecture et d'édition des livres.

Cette ouverture technologique a un impact très important pour les éditeurs comme pour les lecteurs. Les éditeurs peuvent maîtriser leur chaîne de fabrication et la qualité de leur production, à long terme. D'autre part cette ouverture permet de construire un écosystème varié de diffusion et de distribution : personne ne détient à lui seul les clefs permettant de gérer, de vendre, de lire, d'annoter les livres qui constituent le fonds propre de chaque éditeur.

Les lecteurs, de leur côté, ont à leur disposition de nombreux outils de lecture. Différentes applications, libres ou non, gratuites ou payantes, sont disponibles sur le marché pour afficher leurs fichiers, les classer, les administrer.

Le format propriétaire MoBi ne peut être lu qu'avec des applications dédiées fournies par Amazon qui possède également son propre support de lecture, le Kindle. À l'inverse, l'EPUB est lisible directement (sans conversion ou installation d'applications supplémentaires) sur tous les dispositifs de lecture tels que tablettes, liseuses, smartphones, ordinateurs... à l’exception du Kindle.

La réalisation d'ouvrages numériques au format EPUB s'inscrit fondamentalement dans un contexte de création et d'usages favorisant la liberté technologique et, en conséquence, la liberté commerciale. En utilisant ce format, l'éditeur comme le lecteur n'est pas contraint de dépendre d'une plateforme unique de vente, d'un seul acteur numérique du secteur ou d'un dispositif de lecture en particulier. C'est sans doute en raison de cette adaptabilité et de cette souplesse que le format EPUB s'impose aujourd'hui comme un standard et est adopté par la plupart des grands fabricants et vendeurs de livres numériques.

Présentation du contenu de l'ouvrage

Cet ouvrage s'adresse principalement aux éditeurs indépendants et aux professionnels de la mise en page souhaitant s'initier à la création de livres au format EPUB. L'objectif est de les accompagner sur un plan pratique dans la création de ce type de documents numériques à l'aide de logiciels libres jusqu'à les familiariser avec les éléments de code qui permettront d'en affiner la qualité et le contenu.

La fabrication d'un livre n'inclut pas la protection des fichiers au moyen de DRM (digital rights management) ou de marquages spécifiques. Ces techniques sont appliquées, le cas échéant, par les distributeurs auxquels chaque éditeur confiera son catalogue. Nous ne les aborderons donc pas dans ce livre pas plus que les aspects commerciaux et juridiques de l'édition numérique tels que le contrat de l'auteur, les licences de diffusion, etc.

Afin de répondre précisément aux enjeux actuels soulevés par le livre électronique et le format EPUB en particulier, ce livre a été structuré en cinq sections :

  • Créer un epub se consacre à la méthode, comme aux limites, de la réalisation d'un epub de la façon la plus automatique possible, c'est-à-dire sans avoir à manipuler le code des fichiers ;
  • Enrichir son epub conduit doucement le lecteur vers l'acquisition des connaissances afin de profiter pleinement des nombreuses possibilités offertes par le format EPUB et de contourner les limitations de certains logiciels en éditant directement le code. De nombreuses astuces sont également développées au fil des chapitres afin d'ajouter des images, des vidéos, de la musique ou d'incorporer une fonte numérique ;
  • Contrôler ses fichiers est consacré aux nombreuses vérifications à réaliser à la fin de la création du livre électronique afin d'en éprouver la qualité et l'interopérabilité ;
  • Annexes. Cette dernière section dresse la liste des références utilisées pour l'écriture de ce livre, et apporte des précisions précieuses pour sa compréhension au travers d'un glossaire et de l'exposé du schéma de métadonnées de Dublin Core et les spécifications de l'EPUB 3.

Il y a une erreur de communication avec le serveur Booktype. Nous ne savons pas actuellement où est le problème.

Vous devriez rafraîchir la page.