Étiquette : zip

Dissection d’un fichier ebook

On va se concentrer ici sur le format EPUB, qui est le standard dans le métier, et à partir duquel on peut produire tous les autres.

On ne vous l’avait peut-être pas dit, mais un fichier EPUB est en fait un fichier ZIP. C’est comme si on avait zippé un paquet de fichiers ensemble et qu’on avait renommé le résultat de mon_paquet_de_fichiers.zip à mon_paquet_de_fichiers.epub.

Ça veut dire que vous pouvez faire l’opération inverse, remplacer le .epub par .zip sur n’importe quel fichier EPUB, et votre programme de dézippage le reconnaitra comme l’un des siens. Ah ben tiens, décompressons et voyons ce qu’il y a dedans.

Peut-être n’aviez vous pas été prévenu, mais un fichier EPUB est plein de pages HTML. Où plutôt XHTML, ce qui est une façon maniérée de dire « HTML bien écrit ». Vous aurez peut-être besoin d’aller les trouver dans un dossier dénommé OEBPS.… Lire la suite

Advertisment ad adsense adlogger