Extraire metadata depuis un fichier PDF

Petit nouveau ! | 6 Messages

21 avr. 2010, 10:59

Salut,

Je souhaite savoir s'il existe des librairies en php permettant d'extraire les metadata depuis un fichier PDF. En effet, je suis entrain de gérer les fichier bibtex et je suis amené à extraire les informations inportantes depuis un article sous format pdf (Author, date, keywords....) et créer un fichier bibtex.

Avez-vous une idée ?


Merci

ViPHP
ViPHP | 5462 Messages

21 avr. 2010, 11:10

hello, tu dois pouvoir faire ca avec PDFlib, Zend_PDF, FPDF

Petit nouveau ! | 6 Messages

21 avr. 2010, 11:15

PDFlib et FPDF ne permetten pas d'extraire les données, on peut juste créer un fichier pdf.

ViPHP
ViPHP | 5462 Messages

21 avr. 2010, 11:22

zend_pdf alors :wink:

Petit nouveau ! | 6 Messages

21 avr. 2010, 11:25

Avez-vous un exemple ? Zend_PDF est il payant ?

ViPHP
ViPHP | 5462 Messages

21 avr. 2010, 11:26

Avez-vous un exemple ? Zend_PDF est il payant ?
http://zendframework.com/manual/fr/zend.pdf.html
et oui c'est gratuit

Petit nouveau ! | 6 Messages

21 avr. 2010, 15:02

Bonjour,
j'ai installé zend et j'ai écrit ce bout de code :
require_once('Zend/Pdf.php');
                $pdfPath="test2.pdf";
                try
                {
                    $pdf = Zend_Pdf::load($pdfPath);
                     //$pdf = new Zend_Pdf($pdfPath);
                     echo count($pdf->properties);
                    foreach ($pdf->properties as $valeur) {
                        echo $valeur;
                    }

                   
                
                }
Mais j'ai eu cette erreur Outline childs load error. Apparement, il y a un problème de lecture du fichier PDF car quand je change de fichier ça marche. Est ce qu'il faut utiliser une version bien déterminée de pdf ?