Etapes:
- Dans DjVU: export to file... Choisir BMP (011_0001.bmp). Sauver.
Code : Tout sélectionner
./jbig2 -s -p 011_0001.bmp JBIG2 compression complete. pages:1 symbols:712 log2:10
Code : Tout sélectionner
python pdf.py output >011_0001.pdf
Code : Tout sélectionner
$ ./jbig2 -s -p 011_0001.bmp
Error in findFileFormatStream: failed to read first 12 bytes of file
JBIG2 compression complete. pages:1 symbols:712 log2:10
Code : Tout sélectionner
convert -colors 2 -depth 1 033_0001.bmp output.bmp
Code : Tout sélectionner
$ convert -colors 2 -depth 1 033_0001.bmp output.bmp
$ ./jbig2 -s -p output.bmp
JBIG2 compression complete. pages:1 symbols:1642 log2:11
$ python pdf.py output >033_0001.pdf
$ ls -l 033* output*
-rwxrwxrwx+ 1 Samuel Aucun 24956442 Feb 5 17:18 033_0001.bmp
-rw-r--r--+ 1 Samuel Aucun 59052 Feb 5 17:20 033_0001.pdf
-rwxrwxrwx+ 1 Samuel Aucun 7381 Feb 5 17:20 output.0000
-rw-r--r--+ 1 Samuel Aucun 1039262 Feb 5 17:20 output.bmp
-rwxrwxrwx+ 1 Samuel Aucun 50689 Feb 5 17:20 output.sym
Notes:
- Il semblerait que les dernières versions de ImageMagick(http://www.imagemagick.org/script/binary-releases.php) supportent le format DjVU en entrée (hum.. après vérif c'est pas évident "convert.exe: no decode delegate for this image format manueltechniqueto8.djvu @ error/constitute.c/ReadImage/550"). Du coup il y aurait probablement moyen d'automatiser la conversion. On peut aussi passer par http://djvu.sourceforge.net/doc/man/ddjvu.html
- Le PDF produit ne contient pas de données textuelles. Ca n'est pas terrible si on veut faire des recherches. Par contre ici est indiqué une méthode pour préserver la couche texte du fichier djvu.