Extraire texte d'un PDF

Eléphant du PHP | 86 Messages

06 févr. 2009, 12:15

Bonjour,

Comme indiquer dans le sujet je souhaite extraire le texte d'un PDF automatiquement en PHP, étant sur un serveur mutualisé je n'ai pas la possibilité d'installer quelque chose sur le serveur.

Merci de votre aide.

Administrateur PHPfrance
Administrateur PHPfrance | 11457 Messages

06 févr. 2009, 14:33

Déjà, il faut vérifier si le PDF te l'autorise.
Le format PDF permet plusieurs niveuax de sécurité
et il est possible à l'auteur d'interdire la copie, l'impression,...
d'un document PDF afin de le protéger.

Eléphant du PHP | 86 Messages

06 févr. 2009, 15:00

Les pdf uploader via le site ne sont pas protégés, car celui qui les upload les fait.

[Note : ce message a été posté de manière anonyme avant d'être réattribué à son auteur]

Invité
Invité n'ayant pas de compte PHPfrance

23 févr. 2009, 23:08

Bonsoir,

j'avais à l'époque transformé mon pdf en fichier txt et lu le contenu du txt pour effectuer une recherche.

C'était il y a quelques années déjà, il doit y avoir de nouveaux outils maintenant je suppose... !

Avatar du membre
Administrateur PHPfrance
Administrateur PHPfrance | 9782 Messages

24 févr. 2009, 00:08

Bonjour,

Sans vouloir paraitre défaitiste, il me semble que cela est impossible si tu ne peux rien installer sur ton serveur.

Si tu peux installer qqchose sur ton serveur, pdftotext semble être une solution envisageable:
http://en.wikipedia.org/wiki/Pdftotext
Quand tout le reste a échoué, lisez le mode d'emploi...

Mammouth du PHP | 965 Messages

24 févr. 2009, 11:05

Salut à toi !

Et bien j'ai rencontrer un suisse au forum AFUP qui m'as donné de precieux conseil pour le traitement de PDF, je te c/c son mail :

Utilitaires PDF en ligne de commande: pdftk
(http://www.accesspdf.com/pdftk/)
Existe pour Windows et Linux, permet de convertir du postscript en texte, de
merger 2 PDF, etc.
Tu peux par exemple convertir les PDF en texte et mettre ensuite le contenu
dans ta base MySQL.

Index spécial pour MySQL (FULLTEXT),
http://dev.mysql.com/doc/refman/5.0/fr/ ... earch.html
Ceci va te permettre de faire des recherches de pertinence (genre Google)
dans les champs textes

Bon courage.