par
Berzemus » 06 juil. 2012, 19:55
Un PDF n'est pas vraiment un format importable dans une base de données.
Ceci dit, avec un peu d'huile de coude, si le recopiage à la main serait trop fastidieux, il est possible d'arriver à quelque chose, mais cela va dépendre fortement de la mise en page et de la structure du PDF.
Déjà, il faut que ce soit un PDF texte, ou OCR-isé de façon acceptable. Depuis le Acrobat Reader, il devrait être possible (quelque part sous "fichier") de n'enregistrer qu'une version texte brut du contenu.
A partir de ce texte brut, j'imagine qu'il serait possible d'écrire un script qui pourra l'interpréter, moyennant une belle expression régulière par exemple, pour ensuite l'insérer dans la base de données (dont PhpMyAdmin n'est qu'une interface de gestion).
Ceci dit, ce n'est pas à la portée de tout le monde, mais c'est un beau projet pour débuter: il y a un but spécifique à atteindre.
Un PDF n'est pas vraiment un format importable dans une base de données.
Ceci dit, avec un peu d'huile de coude, si le recopiage à la main serait trop fastidieux, il est possible d'arriver à quelque chose, mais cela va dépendre fortement de la mise en page et de la structure du PDF.
Déjà, il faut que ce soit un PDF texte, ou OCR-isé de façon acceptable. Depuis le Acrobat Reader, il devrait être possible (quelque part sous "fichier") de n'enregistrer qu'une version texte brut du contenu.
A partir de ce texte brut, j'imagine qu'il serait possible d'écrire un script qui pourra l'interpréter, moyennant une belle expression régulière par exemple, pour ensuite l'insérer dans la base de données (dont PhpMyAdmin n'est qu'une interface de gestion).
Ceci dit, ce n'est pas à la portée de tout le monde, mais c'est un beau projet pour débuter: il y a un but spécifique à atteindre.