Sites


Créer un Epub

Convertir son fonds à partir de fichiers PDF

Comme nous l'avons vu en introduction, le format PDF n'est pas le format idéal comme point de départ à la création de vos fichiers EPUB. Nos expériences respectives nous ont montré qu'il n'y a cependant parfois pas d'autres choix que d'en passer par là, les PDF de l'imprimeur étant souvent les seuls fichiers à votre disposition.

Cette méthode, malgré ses inconvénients, a la particularité de ne pas bousculer la chaîne de fabrication papier traditionnelle, y compris pour de nouveaux ouvrages.

Quelles possibilités avons-nous ?

Autant vous le dire immédiatement, il n'existe pas, à ce jour, de logiciel (qu'il soit libre ou non) capable de convertir directement et automatiquement un fichier PDF en fichier EPUB conforme aux spécifications EPUB. Que ce soit du point de vue de la mise en page, aussi simple soit-elle, des enrichissements ou de la mise en forme, le résultat n'est jamais correct.

On peut, bien entendu, trouver des outils, notamment des outils en ligne, proposant ce type de conversion. Toutefois, le résultat obtenu est généralement de piètre qualité, tant sur la forme (respect de la mise en page) que sur le fond (conformité aux spécifications EPUB). En choisissant ce type d'outil, vous devrez, à coup sûr, retoucher votre fichier EPUB de manière approfondie et cela engendrera bien souvent une perte de temps importante, à l'inverse de l'effet recherché.

Cependant, si vous souhaitez réaliser quelques livres numériques au format EPUB à partir de fichiers PDF, nous vous proposons dans ce chapitre de le faire avec Calibre, une solution simple qui propose la conversion. Le résultat obtenu sera imparfait et nécessitera des retouches page à page du texte au moyen, par exemple, du logiciel Sigil (pour en savoir plus sur le fonctionnement de Sigil, vous pouvez vous reporter au chapitre « Créer un epub avec Sigil »).

La conversion automatique avec Calibre

Calibre est un logiciel libre développé pour gérer une bibliothèque de livres numériques et destiné aux lecteurs pour un usage privé. Il permet également de lire des livres numériques de tous formats, de les convertir dans d'autres formats, dont l'EPUB, et d'enrichir les métadonnées de ces ouvrages, notamment à partir de sources externes.

Dans ce chapitre nous nous attacherons uniquement à la fonction de conversion du logiciel.

Trouver des livres 

Avant de passer à la conversion, il va falloir disposer de quelques livres. Vous en avez peut-être déjà quelques-uns, mais nous vous proposons de voir la très pratique fonction de recherche de livre de Calibre. De plus cela nous permettra de lancer une conversion en ayant éventuellement le même livre à convertir. 

  1. Installez Calibre en récupérant votre version sur la page de téléchargement de calibre ou directement ici. Calibre est disponible pour chaque grand système d'exploitation et marchera de façon similaire sur chaque.
    • Télécharger Calibre pour mac
    • Télécharger Calibre pour Windows
    • Télécharger Calibre pour Linux Pour Linux: ouvrez un terminal, passez en mode super-utilisateur et collez ceci : 
    • python -c "import sys; py3 = sys.version_info[0] > 2; u = __import__('urllib.request' if py3 else 'urllib', fromlist=1); exec(u.urlopen('http://status.calibre-ebook.com/linux_installer').read()); main()"
  2. Démarrez Calibre. Vous obtenez alors la fenêtre principale du logicielle, séparée en 3 zones : en centre, la liste des livres importés dans calibre; à gauche, la même liste classée par mots clés, à droite, l'aperçu de la couverture avec en dessous les formats dans lequel le livre est disponible. Pour lire un livre, il suffit de double cliquer sur son nom ou sur le format souhaité.  Calibre lance alors son lecteur de livre numérique intégré.
    interface de gestion de livre numérique de Calibre
  3. Pour ajouter des livres à Calibre deux solutions s'offrent à nous : 
    1. cliquez sur Ajout de livre dans une bibliothèque Calibre pour ouvrir votre fichier PDF que vous pourrez sélectionner dans vos dossier à l'aide de la fenêtre de navigation;

      Si vous n'en disposez pas pour ce test utilisez la fonction de recherche automatique de livre numérique

    2. Cliquez sur le bouton Obtenir des livres Télécharger des livres numériques avec Calibre;
    3. Notez un titre ou un auteur dans la fenêtre qui apparaît;
    4. En ajoutant formats:"=PDF" ou formats:"=EPUB" ou encore languages:"=français", vous pouvez trier encore plus parmi les nombreux résultats possibles. Attention cependant pour la langue, cette information n'est pas toujours fiable. Nous tenterons de nous en souvenir lorsque nous ferons la conversion;
    5. Choisissez éventuellement les sites sur lesquels vous préférez effectuer votre recherche;
    6. Cliquez sur Rechercher à droite. Laissez un peu de temps à calibre pour qu'il parcoure les catalogues;
    7. Lorsque la liste est complète, téléchargez la version qui vous plaît, ici nous prenons une version sans DRM identifiée par un cadenas (ou)vert Rechercher des livres sans DRM.
      Recherche de livres numériques dans Calibre
    8. Si le livre est disponible dans plusieurs formats, une fenêtre s'affiche et vous propose de choisir. Dans notre cas, choisissez PDF, de manière à ce que nous puissions effectuer la conversion en EPUB par la suite;
    9. Vous pouvez alors fermer la fenêtre de recherche et le livre apparaît automatiquement dans votre bibliothèque numérique.

Convertir des livres au format EPUB

Bien sûr, nous pourrions en rester là, mais les livres au format EPUB ayant des avantages indéniables par rapport au PDF nous allons effectuer une conversion.

  1. Sélectionnez votre fichier et cliquez sur Bouton de conversion de livre dans Calibre pour lancer la conversion ;
  2. Vous voyez apparaître une nouvelle fenêtre qui vous permet de paramétrer différentes options;
    Conversion avec Metadonnées dans Calibre
  3. Tout en haut vérifiez que le format d'entrée est bien PDF et que le format de sortie (à droite) est bien EPUB. Vous pouvez alors modifier les différentes informations qui vous semblent importantes :
    • Sous l'aperçu principal, vous pourrez choisir votre image de couverture à l'aide du bouton de navigation dans les dossiers;
    • À droite, les étiquettes (mot-clés) qui faciliteront les recherches aboutissant à vos livres;
    • La série si elle a lieu;
    • Et dans la grande zone éventuellement un descriptif.
  4. Concernant les autres options, elles changent assez rarement le résultat, calibre dit même pour le Traitement heuristique qu'il "peut engendrer un résultat pire que l'original". Nous allons nous contenter ici d'une configuration basique en laissant les options par défaut.
  5. Cliquer sur le bouton OK pour lancer le processus de conversion. En bas à droite, la tâche est active. Lorsque Tâches indiquera 0, la conversion sera arrivée à son terme.
  6. Une fois la conversion terminée, le format est listé avec le précédent associé à votre livre.
    Formats de livres disponible dans Calibre
    Un clic droit sur le titre du livre vous permettra d'enregistrer votre fichier EPUB : Enregistrer sur le disque > enregistrer seulement le format EPUB sur le disque.
  7. Pour vérifier la validité de votre fichier EPUB, utilisez le logiciel Sigil ou l'outil EpubCheck comme indiquer dans le chapitre Vérifier la validité de votre fichier. Dans Sigil, vous pourrez scinder les parties, modifier la table des matières et rajouter les métadonnées importantes comme l'ISBN.
Si vous constatez que le fichier obtenu n'est pas valide, les messages d'erreur vous indiqueront quels fichiers sont à retoucher.

Vous pourrez bien entendu affiner la conversion automatique PDF vers EPUB en jouant avec les différentes options de conversion offertes par Calibre pour améliorer le résultat final. Sachez toutefois que vous aurez systématiquement à retoucher le code pour obtenir un fichier correct et conforme aux spécifications EPUB (voir chapitre Mieux comprendre l'EPUB).

Nous avons choisi comme exemple un livre du Domaine Public « Candide, ou l'Optimisme » de Voltaire (le titre est bien adapté à ce chapitre). Le fichier PDF choisi ici n'est pas exactement le reflet d'un « PDF Imprimeur », car il a été généré automatiquement à partir de sources XML, et non à partir d'un logiciel de mise en page. Il nous donne cependant une bonne idée des limites de la conversion automatique de manière générale, et de l'outil de conversion de Calibre en particulier.

Calibre peut vous être utile pour faire vos premiers pas et pour comprendre le principe de la conversion (notamment en approfondissant les options de cette fonction). Cependant il n'est pas, rappelons-le, en tant qu'éditeur, il sera très difficile d'utiliser Calibre comme seul outil de conversion de vos ouvrages, même s'il est l'un des plus performants à l'heure actuelle. Vos livres nécessiteront un travail d'amélioration, ou un autre flux de production basé sur les fichiers sources.

La conversion semi-automatisée

La conversion « semi-automatisée » est intéressante pour un grand nombre de fichiers PDF à traiter. Elle demande une réelle expertise informatique, car nous pensons que dans la majorité des cas elle exige l'utilisation de plusieurs outils ou le développement d'une chaîne de traitement spécifique.

Nous évoquons ici les étapes de la conversion semi-automatisée pour vous donner une idée générale de ce que vous aurez à voir avec un développeur (qu'il soit externe ou interne à votre structure) :

  • extraction du texte et des images à partir du fichier PDF (pdftotxt, Adobe Acrobat Pro...) ;
  • identification des différentes parties du livre (sections, chapitres, paragraphes...) dans un logiciel de traitement de texte tel que OpenOffice.org ou LibreOffice ;
  • automatisation de la génération des fichiers XHTML (HtmlTidy...) ou conversion à partir des extensions EPUB d'OpenOffice.org tel que mentionnées dans les prochains chapitres;
  • automatisation de la génération des fichiers spécifiques au format EPUB (.opf, etc.) et du fichier EPUB final (Sigil...) ;
  • contrôle qualité. 

La conversion manuelle

La dernière possibilité de « conversion » à partir d'un fichier PDF consiste en fait à extraire le texte à l'aide d'un simple copier/coller (où à l'aide d'un outil de conversion tel que pdftotxt) et les images et à créer le fichier EPUB. Pour créer un fichier epub à partir du texte, vous pouvez vous référer aux trois chapitres suivants. Cette méthode est évidemment pas la plus longue. 

Conclusion

Pour convertir votre fonds éditorial existant au format EPUB, vous avez donc plusieurs possibilités, sachant que si vous décidez de le faire vous-même, il vous faudra plus ou moins de temps en fonction de vos ressources techniques. Nous pensons que dans la majorité des cas, l'utilisation de Calibre peut s'avérer une bonne base, à la fois simple, rapide et fiable tout en sachant qu'il ne s'agit qu'un début et que le fichier demandera encore du travail avant une publication éventuelle au format EPUB, dans l'objectif de le rendre compatible avec le maximum de tablettes et d'éviter les lecteurs mécontents.

Il y a une erreur de communication avec le serveur Booktype. Nous ne savons pas actuellement où est le problème.

Vous devriez rafraîchir la page.