Question Problème avec des accents lors de l'utilisation d'ImageMagick ou de Ghostscript pour convertir des PDF en images


J'ai un problème lors de la conversion de fichiers PDF en images avec ImageMagick ou Ghostscript. Tous les caractères accentués disparaissent de l'image convertie. J'ai trouvé deux personnes ayant le même problème et apparemment en train de mettre à jour le paquetage imagemagick et ghostcript le corrigeait, mais pas pour moi.

J'utilise ce fichier PDF pour tous les tests que j'ai effectués: https://www.dropbox.com/s/3gso0sw1e1n8f9r/error-with-accents.pdf?dl=0

J'ai un serveur Ubuntu 14.04.2 LTS sur Azure où j'ai besoin d'ImageMagick pour fonctionner. Depuis les dépôts officiels, j'ai ImageMagick 6.7.7 et Ghostscript 9.10. Plus tard, j'ai essayé de les mettre à niveau afin de résoudre mon problème et maintenant j'ai également ImageMagick 6.8.9-10 en cours d'exécution sur /opt/imagemagick-6.8 dossier et j'ai ajouté le dépôt 15.04 d'Ubuntu afin que je puisse installer Ghostscript 9.15 directement via apt-get. Aucun d'entre eux n'a résolu le problème pour moi.

Voici mes dernières tentatives sur le serveur Ubuntu 14.04:

$ lsb_release -a
No LSB modules are available.
Distributor ID: Ubuntu
Description:    Ubuntu 14.04.2 LTS
Release:    14.04
Codename:   trusty

$ /opt/imagemagick-6.8/bin/convert -version
Version: ImageMagick 6.8.9-10 Q16 x86_64 2015-07-30 http://www.imagemagick.org
Copyright: Copyright (C) 1999-2014 ImageMagick Studio LLC
Features: DPC OpenMP
Delegates: jng jpeg png x xml zlib

$ /opt/imagemagick-6.8/bin/convert -list configure |grep DELEGATES
DELEGATES      mpeg jng jpeg png ps x xml zlib

$ /opt/imagemagick-6.8/bin/convert error-with-accents.pdf -verbose -alpha off -resample 150 -density 150 -quality '80' im-test.jpg
   **** Warning: considering '0000000000 XXXXX n' as a free entry.

   **** This file had errors that were repaired or ignored.
   **** The file was produced by: 
   **** >>>> Mac OS X 10.10.4 Quartz PDFContext <<<<
   **** Please notify the author of the software that produced this
   **** file that it does not conform to Adobe's published PDF
   **** specification.

error-with-accents.pdf=>im-test.jpg PDF 595x794=>1240x1654 1240x1654+0+0 16-bit sRGB 172KB 0.440u 0:00.240

$ gs -v
GPL Ghostscript 9.15 (2014-09-22)
Copyright (C) 2014 Artifex Software, Inc.  All rights reserved.

$ gs -dBATCH -dNOPAUSE -sDEVICE=jpeg -sOutputFile=gs-test.jpg error-with-accents.pdf 
GPL Ghostscript 9.15 (2014-09-22)
Copyright (C) 2014 Artifex Software, Inc.  All rights reserved.
This software comes with NO WARRANTY: see the file PUBLIC for details.
   **** Warning: considering '0000000000 XXXXX n' as a free entry.
Processing pages 1 through 1.
Page 1

   **** This file had errors that were repaired or ignored.
   **** The file was produced by: 
   **** >>>> Mac OS X 10.10.4 Quartz PDFContext <<<<
   **** Please notify the author of the software that produced this
   **** file that it does not conform to Adobe's published PDF
   **** specification.

$ convert -version
Version: ImageMagick 6.7.7-10 2014-03-06 Q16 http://www.imagemagick.org
Copyright: Copyright (C) 1999-2012 ImageMagick Studio LLC
Features: OpenMP    

$ convert -list configure |grep DELEGATES
DELEGATES     bzlib djvu fftw fontconfig freetype jbig jpeg jng jp2 lcms2 lqr lzma openexr pango png rsvg tiff x11 xml wmf zlib

$ convert error-with-accents.pdf -verbose -alpha off -resample 150 -density 150 -quality '80' im-test-6.7.7.jpg
   **** Warning: considering '0000000000 XXXXX n' as a free entry.

   **** This file had errors that were repaired or ignored.
   **** The file was produced by: 
   **** >>>> Mac OS X 10.10.4 Quartz PDFContext <<<<
   **** Please notify the author of the software that produced this
   **** file that it does not conform to Adobe's published PDF
   **** specification.

error-with-accents.pdf=>im-test-6.7.7.jpg PDF 595x794=>1240x1654 1240x1654+0+0 16-bit DirectClass 160KB 0.490u 0:00.279

Tous avec les mêmes résultats:
https://www.dropbox.com/s/eob6y234x37s864/gs-test.jpg?dl=0
https://www.dropbox.com/s/96z1pkksdn1dpr4/im-test.jpg?dl=0
https://www.dropbox.com/s/dev0kbza2c8v2gf/im-test-6.7.7.jpg?dl=0

Je suis capable d'exécuter Ghostscript et ImageMagick correctement sous Mac OS. Et, selon ce post, les versions que j'ai sur Ubuntu devraient fonctionner. Donc, je pense que c'est lié aux polices FreeType. Ce que je ne sais rien sur la façon de résoudre ce problème. De l'aide?


1
2017-07-30 19:07


origine




Réponses:


Grâce à Kurt Pfeifle sur Stackoverflow pour la réponse.

Le problème était la version de Ghostscript installée sur le serveur. Puisque la dernière version de Ghostscript sur le dépôt Ubuntu est 9.15, j'ai téléchargé le fichier officiel paquet binaire pour linux x64 sur le site Ghostscript.

Puis je me suis substitué /usr/bin/gs binaire avec celui à l'intérieur du paquet et tout fonctionnait correctement. Plus de problèmes avec les accents.


1
2017-08-14 15:21





J'ai eu le même genre de problèmes en essayant d'imprimer un pdf avec des accents. Je suis arrivé à la conclusion que c'était un problème de ghostscript, puisque CUPS l'utilisait tout en rasterisant le pdf à travers gstoraster filtre. J'ai également réalisé qu'un récent binaire de ghostscript en mode autonome faisait un excellent travail.

MAIS Je ne conseillerais pas de souscrire /usr/bin/gs car cela pourrait casser des dépendances (CUPS par exemple)!

Au lieu de cela, je vous suggère de regarder l'outil pdfimages de poppler-utils 


1
2017-11-10 09:35



la question est tout à fait résolue et il n'y a pas besoin de poster une réponse. si vous avez un autre problème, posez une question ici - Neil