Page 1 sur 1
Recherche parser pdf
Posté : 22 déc. 2009, 19:08
par blubsy
Bonjour, depuis plusieurs jours je recherche un parser de fichier pdf afin d'indéxer des fichiers (pdf biensur).
J'ai plusieurs pistes mais bon je recherche des conseils et votre expériences pour mettre en place mon script.
Merci par avance pour votre aide.
Bonne soirée.
Re: Recherche parser pdf
Posté : 23 déc. 2009, 14:54
par enneite
En php, en open source, tu as FPDF et EZPDF pour travailler sur du PDF en PHP.
Le plus connu avec le plus de source, c'est FPDF.
Après en lociciel payant, il y a pdflib, les fonctions y sont codées dans des modules, donc c'est plus rapide que FPDF à priori. (la rapidité ne se fait sentir que sur des documents très lourds)
mais bon pour la plupart des projets melant PDF et PHP, FPDF c'est le mieux.
Re: Recherche parser pdf
Posté : 23 déc. 2009, 15:54
par blubsy
Bonjour et tous d'abord merci pour ta réponse.
FPDF est pas mal mais en gros il s'agit d'une classe afin de créé des fichier pdf et moi je cherche un peu l'inverse :
A partir d'un document pdf, connaitre les textes qui le contient afin d'indéxer au mieux le document (le but étant de faire des recherches dans des documents pdf à partir d'un script php).
Merci par avance pour vos conseils.
Re: Recherche parser pdf
Posté : 04 janv. 2010, 21:24
par baden32
Salut,
Je suis à la recherche de la même fonctionnalité que toi à propos de ces pdfs. As-tu trouvé quelque chose de valable?
De mon côté, j'en arrive à la conclusion que sans un accès au shell pour lancer une commande comme pdf2text, je n'y arriverai pas...
BD
Re: Recherche parser pdf
Posté : 04 janv. 2010, 21:53
par blubsy
Tous pareil...
Bonsoir, et non je n'ai pas trouver de meilleur solution que
xpdf.
En faite je ne l'ai pas encore testé mais je vais m'en occupé dans la semaine.
Je trouve cela étrange de ne rien trouvé en php mais bon tans pis.
Si tu test une autre solution je suis preneur.
Bonne soirée.
Re: Recherche parser pdf
Posté : 04 janv. 2010, 23:32
par stealth35
pour indexer tu peu utiliser Lucene via Zend_Search_Lucene
Re: Recherche parser pdf
Posté : 04 janv. 2010, 23:49
par blubsy
Bonsoir merci pour l'info plus qu'a me mettre à zend pour comprendre comment mettre ça en place.
En tous cas merci.