Page 1 sur 1

Extraire metadata depuis un fichier PDF

Posté : 21 avr. 2010, 10:59
par mimosa803
Salut,

Je souhaite savoir s'il existe des librairies en php permettant d'extraire les metadata depuis un fichier PDF. En effet, je suis entrain de gérer les fichier bibtex et je suis amené à extraire les informations inportantes depuis un article sous format pdf (Author, date, keywords....) et créer un fichier bibtex.

Avez-vous une idée ?


Merci

Re: Extraire metadata depuis un fichier PDF

Posté : 21 avr. 2010, 11:10
par stealth35
hello, tu dois pouvoir faire ca avec PDFlib, Zend_PDF, FPDF

Re: Extraire metadata depuis un fichier PDF

Posté : 21 avr. 2010, 11:15
par mimosa803
PDFlib et FPDF ne permetten pas d'extraire les données, on peut juste créer un fichier pdf.

Re: Extraire metadata depuis un fichier PDF

Posté : 21 avr. 2010, 11:22
par stealth35
zend_pdf alors :wink:

Re: Extraire metadata depuis un fichier PDF

Posté : 21 avr. 2010, 11:25
par mimosa803
Avez-vous un exemple ? Zend_PDF est il payant ?

Re: Extraire metadata depuis un fichier PDF

Posté : 21 avr. 2010, 11:26
par stealth35
Avez-vous un exemple ? Zend_PDF est il payant ?
http://zendframework.com/manual/fr/zend.pdf.html
et oui c'est gratuit

Re: Extraire metadata depuis un fichier PDF

Posté : 21 avr. 2010, 15:02
par mimosa803
Bonjour,
j'ai installé zend et j'ai écrit ce bout de code :
require_once('Zend/Pdf.php');
                $pdfPath="test2.pdf";
                try
                {
                    $pdf = Zend_Pdf::load($pdfPath);
                     //$pdf = new Zend_Pdf($pdfPath);
                     echo count($pdf->properties);
                    foreach ($pdf->properties as $valeur) {
                        echo $valeur;
                    }

                   
                
                }
Mais j'ai eu cette erreur Outline childs load error. Apparement, il y a un problème de lecture du fichier PDF car quand je change de fichier ça marche. Est ce qu'il faut utiliser une version bien déterminée de pdf ?