Initiation à l'Electronique Numérique (collection pascalien)

Les bouquins, les scans, les pdf ou les liens qui vont bien... ici c'est la bibliothèque.

Modérateurs : Papy.G, fneck, Carl

Daniel
Messages : 17316
Inscription : 01 mai 2007 18:30
Localisation : Vaucluse
Contact :

Initiation à l'Electronique Numérique (collection pascalien)

Message par Daniel »

initiation_electronique_numerique.png
initiation_electronique_numerique.png (644.26 Kio) Consulté 4223 fois
Livre scanné par pascalien.

@pascalien: Merci pour les scans. Ils sont de bonne qualité, j'apprécie la compression sans perte :wink:
Je les ai mis en forme avec ScanTailor. Les fichiers tiff sont téléchargeables (pendant 30 jours) avec ce lien : Fichiers tiff (368 Mo)

Il reste à enlever les petits défauts (essentiellement des taches sur la vitre du scanner), je n'ai pas eu le temps de le faire.
Ensuite la difficulté, pour ces livres en couleurs avec photos, est de trouver le bon compromis qualité/taille pour un fichier pdf.
En local la taille n'est pas un problème, par contre pour une diffusion sur internet il faut compresser. Le choix est à l'appréciation de chacun.

Pour la documentation Thomson, j'utilise exclusivement le format djvu. Il a un taux de compression excellent, il est incomparable pour le texte monochrome, malheureusement il est très mauvais pour les images en couleur.
La qualité des images est médiocre, le texte est bien lisible, la taille est raisonnable (1,27 Mo) :
initiation_electronique_numerique_djvu.zip
(1.27 Mio) Téléchargé 154 fois
Daniel
L'obstacle augmente mon ardeur.
Avatar de l’utilisateur
Kristof
Messages : 368
Inscription : 08 mars 2021 10:44
Localisation : Narbonne (11)
Contact :

Re: Initiation à l'Electronique Numérique (collection pascalien)

Message par Kristof »

Merci pour le partage. PNG c'est bien aussi, pas de perte, et c'est un peu compressé. Un PDF ca peut le faire aussi, ca reste plus pratique que des images.
Avatar de l’utilisateur
Mokona
Messages : 1040
Inscription : 17 déc. 2016 22:01
Localisation : Nord Est des Yvelines
Contact :

Re: Initiation à l'Electronique Numérique (collection pascalien)

Message par Mokona »

Merci pour le partage !
Daniel
Messages : 17316
Inscription : 01 mai 2007 18:30
Localisation : Vaucluse
Contact :

Re: Initiation à l'Electronique Numérique (collection pascalien)

Message par Daniel »

Pour compresser les images sans utiliser DjVu, le format le mieux adapté pour ce type de livre est webp. Il permet la compression avec pertes tout en gardant un texte lisible (donc beaucoup mieux que jpeg).

Les fichiers png sans perte (360 Mo) peuvent être convertis en webp avec la compression maximum pour obtenir une taille de 3,6 Mo (100 fois moins).
Initiation à l'Electronique numérique compressée au format webp

Je ne sais pas si on peut encapsuler les fichiers webp dans un fichier pdf. Si c'est possible, c'est une bonne solution, trois fois plus grosse que DjVu pour une qualité similaire, mais beaucoup plus standard.
Daniel
L'obstacle augmente mon ardeur.
Daniel
Messages : 17316
Inscription : 01 mai 2007 18:30
Localisation : Vaucluse
Contact :

Re: Initiation à l'Electronique Numérique (collection pascalien)

Message par Daniel »

Kristof a écrit : 13 mars 2021 18:37 PNG c'est bien aussi, pas de perte, et c'est un peu compressé.
Pour ce livre les fichiers png ont une taille de 360 Mo, le fichier djvu a une taille de 1,3 Mo.
Il faut choisir entre qualité et taille. Tout dépend de l'usage que l'on veut en faire.
Daniel
L'obstacle augmente mon ardeur.
jasz
Messages : 1313
Inscription : 05 oct. 2016 20:05
Localisation : Quelque part dans le 31

Re: Initiation à l'Electronique Numérique (collection pascalien)

Message par jasz »

Pour un tel niveau de compression, il doit y avoir une raison. :?

Mais je doute encore que le djvu et le bon format. Le PDF compresse la couleur de manière identique au B&W pour quelques Ko de plus. On obtient pour des formats A5 (2456x1740) des fichiers de près de 5 Mo par page couleur.
Daniel
Messages : 17316
Inscription : 01 mai 2007 18:30
Localisation : Vaucluse
Contact :

Re: Initiation à l'Electronique Numérique (collection pascalien)

Message par Daniel »

Le format PDF ne compresse pas, c'est un conteneur. Les images qu'il contient peuvent être compressées avec différentes techniques, avec ou sans pertes.

Les taux de compression très élevés du format DjVu sont obtenus par différentes techniques en fonction de la nature des images, et (en particulier pour le texte) grâce à la technique des ondelettes, comme le JBIG2.

Le choix de la technique de compression est fortement dépendant de la nature des images. Pour un livre de ce type (en couleurs avec dessins et photos) les résultats obtenus avec DjVu et Webp sont très différents. DjVu est mauvais pour les photos et plutôt meilleur que webp pour le reste. Webp diffuse beaucoup les couleurs sur l'ensemble de la page mais reste globalement assez réaliste. Je ne sais pas ce que vous en pensez ?
Daniel
L'obstacle augmente mon ardeur.
jasz
Messages : 1313
Inscription : 05 oct. 2016 20:05
Localisation : Quelque part dans le 31

Re: Initiation à l'Electronique Numérique (collection pascalien)

Message par jasz »

Daniel a écrit : 13 mars 2021 22:21 Le format PDF ne compresse pas, c'est un conteneur.
Faux! Dans ce cas le format DOC est aussi un conteneur...
Pour imprimer des plaquettes, mon imprimeur a EXIGE le format PDF ou une maquette papier. Il y a de ça 13 ans... :roll:
Daniel
Messages : 17316
Inscription : 01 mai 2007 18:30
Localisation : Vaucluse
Contact :

Re: Initiation à l'Electronique Numérique (collection pascalien)

Message par Daniel »

Alors, si le format PDF compresse, un membre du forum peut-il créer un fichier pdf à partir des fichiers .tif donnés dans le premier post de ce fil de discussion ? Cela permettra de comparer le taux de compression et la qualité des images. Merci !
Daniel
L'obstacle augmente mon ardeur.
Avatar de l’utilisateur
fneck
Site Admin
Messages : 17424
Inscription : 01 avr. 2007 12:03
Localisation : Drôme Provençale (26)
Contact :

Re: Initiation à l'Electronique Numérique (collection pascalien)

Message par fneck »

Le test que j'ai fait avec la page de couverture du bouquin, format TIF taille initiale 15 Mo.
Ouverture avec la visionneuse de Windows, imprimer en PDF avec l'outil intégré, puis sauvegarde du document. Résultat un PDF de 1,5 Mo.

Donc l'image a bien été compressée maintenant à savoir si c'est le PDF qui a compressé ou la visionneuse avant de créer le fichier.... joker :P
Fabien https://www.system-cfg.com
Les bonnes pratiques de l'utilisateur du forum viewtopic.php?f=14&t=3
Avatar de l’utilisateur
Kristof
Messages : 368
Inscription : 08 mars 2021 10:44
Localisation : Narbonne (11)
Contact :

Re: Initiation à l'Electronique Numérique (collection pascalien)

Message par Kristof »

Je suis pas un pro, mais il me semble que lorsqu"on exporte un document sous libre office vers PDF, il y a des options pour controller la compression des images.
Mais du coup c'est soit sans perte, soit JPG+Params
https://www.mediaforma.com/libreoffice- ... ormat-pdf/
Daniel
Messages : 17316
Inscription : 01 mai 2007 18:30
Localisation : Vaucluse
Contact :

Re: Initiation à l'Electronique Numérique (collection pascalien)

Message par Daniel »

Je suis comme vous, je ne sais pas très bien comment se passe la compression. Si on passe par des conversions en ligne de fichiers d'images en pdf, chaque site produit un résultat différent. Dans pas mal de logiciels de conversion en pdf on peut paramétrer le taux de compression, mais je ne sais pas bien comment ça se passe derrière, en particulier quel algorithme est employé.

J'ai utilisé dans le passé un logiciel pour extraire les images d'un fichier pdf au format natif, c'est à dire au format utilisé dans le fichier .pdf. On peut ainsi récupérer des fichiers jpeg, ou tif CCITT groupe 4, ou autres. Mais à la création du pdf, je n'ai jamais compris comment on choisit le type et les paramètres de compression.

Wikipedia écrit ceci :
Raster images in PDF (called Image XObjects) are represented by dictionaries with an associated stream. The dictionary describes the properties of the image, and the stream contains the image data. (Less commonly, a raster image may be embedded directly in a page description as an inline image.) Images are typically filtered for compression purposes. Image filters supported in PDF include the following general-purpose filters:

ASCII85Decode, a filter used to put the stream into 7-bit ASCII,
ASCIIHexDecode, similar to ASCII85Decode but less compact,
FlateDecode, a commonly used filter based on the deflate algorithm defined in RFC 1951 (deflate is also used in the gzip, PNG, and zip file formats among others); introduced in PDF 1.2; it can use one of two groups of predictor functions for more compact zlib/deflate compression: Predictor 2 from the TIFF 6.0 specification and predictors (filters) from the PNG specification (RFC 2083),
LZWDecode, a filter based on LZW Compression; it can use one of two groups of predictor functions for more compact LZW compression: Predictor 2 from the TIFF 6.0 specification and predictors (filters) from the PNG specification,
RunLengthDecode, a simple compression method for streams with repetitive data using the run-length encoding algorithm and the image-specific filters,
DCTDecode, a lossy filter based on the JPEG standard,
CCITTFaxDecode, a lossless bi-level (black/white) filter based on the Group 3 or Group 4 CCITT (ITU-T) fax compression standard defined in ITU-T T.4 and T.6,
JBIG2Decode, a lossy or lossless bi-level (black/white) filter based on the JBIG2 standard, introduced in PDF 1.4, and
JPXDecode, a lossy or lossless filter based on the JPEG 2000 standard, introduced in PDF 1.5.

Normally all image content in a PDF is embedded in the file. But PDF allows image data to be stored in external files by the use of external streams or Alternate Images. Standardized subsets of PDF, including PDF/A and PDF/X, prohibit these features.
Il semble donc que l'on puisse utiliser la compression JBIG2 (mais pas webp). Par contre comment le spécifier quand on génère le pdf, c'est un mystère.
Daniel
L'obstacle augmente mon ardeur.
Daniel
Messages : 17316
Inscription : 01 mai 2007 18:30
Localisation : Vaucluse
Contact :

Re: Initiation à l'Electronique Numérique (collection pascalien)

Message par Daniel »

fneck a écrit : 14 mars 2021 10:22 Résultat un PDF de 1,5 Mo.
La couverture du livre compressé en webp a une taille de 56K, soit 27 fois moins.
webp.zip
(55.44 Kio) Téléchargé 129 fois

En djvu la taille est de 33K, soit 45 fois moins.
djvu.zip
(32.55 Kio) Téléchargé 125 fois
Dernière modification par Daniel le 14 mars 2021 11:00, modifié 1 fois.
Daniel
L'obstacle augmente mon ardeur.
Zebulon
Messages : 2788
Inscription : 02 nov. 2020 14:03

Re: Initiation à l'Electronique Numérique (collection pascalien)

Message par Zebulon »

Oui le "pdf" c'est la jungle. Il y a Adobe d'un côté et tous les autres. Au boulot, il y a longtemps, j'exportais des fichiers Microsoft Project en PDF pour les diffuser aux contributeurs du projet qui justement n'avaient pas Project sur leur poste (coût de la licence). Pour faire ça j'avais un PDF writer lambda (toujours coût de la licence) et les fichiers PDF mettaient une plombe à s'ouvrir pour un résultat minable. J'ai râlé et obtenu le saint-graal, une licence Acrobat PDF Writer. Le jour et la nuit.

Là où je rejoins Daniel c'est qu'effectivement le format PDF est un conteneur qui encapsule des objets permettant de reconstituer les pages du document. C'est le PDF writer qui va créer ces objets et les instructions permettant au reader de les réagencer pour créer le rendu final de la page. Hors ces writer implémentent plus ou moins la complexité du format PDF. Par exemple il y a des writer qui génèrent juste un JPEG en "imprimant" chaque page du document source et en le collant en guise de page dans le PDF. Je vous laisse imaginer le résultat. :shock:

J'avais un outil qui permettait d'extraire les images d'un PDF et ça sortait exactement les objets tels quels dans des fichiers séparés en une fraction de seconde.
Avatar de l’utilisateur
Gege34
Messages : 639
Inscription : 25 avr. 2015 22:35
Localisation : 31

Re: Initiation à l'Electronique Numérique (collection pascalien)

Message par Gege34 »

Merci.
J'en ai fait une version PDF.
J'utilise Images2PDF de pdfforge, mais il n'est plus édité, on peut encore le trouver ici par exemple. Il a une option qui permet d'inclure des jpeg dans un pdf sans les modifier, on peut donc les optimiser dans un autre programme et différemment selon si c'est une image ou du texte. Ce que j'ai pas fait sur le PDF joint, j'ai juste compressé à 80% avec xnview.
Commodore (64/128/Amiga), HP (28/41/48/50/71/75/200/Prime) et autres (Ti, Canon X07, Psion, Casio, Palm, Thomson, Exl, Amstrad)
Répondre