Manipuler les textes très longs

Petit nouveau ! | 3 Messages

08 juin 2014, 17:31

Bonjour à tous,
J'entame le projet d'une banque de donnée de textes philosophiques (voir projets-entraide/banque-textes-philosop ... 71300.html), et si aucun collaborateur ne me vient en aide (ce qui semble probable) il va falloir que je mette la main à la pâte moi-même. Je vous demande donc vos conseils pour manipuler des textes très longs, puisque ici nous parlons de livres entiers. Dois-je rentrer ces textes complets dans une base de données ? Ca me semblerait assez lourd. Ferais-je mieux de consacrer un fichier à chaque texte, que j'inclurais dans ma page ?
Par exemple, sur une page comme celle-là, où se trouve le texte ? Dans un fichier ou dans une base de données ? http://fr.wikisource.org/wiki/De_la_nat ... xte_entier
Le principe est assez simple, mais je crois que la réalisation va être compliquée...
Merci de m'éclairer sur ce point !

Mammouth du PHP | 2278 Messages

08 juin 2014, 18:07

Bjr,
Dans le cas précis de Wikipedia, le texte est dans la page livre par livre avec une page générale table des matières qui contient les liens vers les divers livres, et idem pour http://remacle.org/
Mais chez Gallica, il s'agit d'une image par page.
Tout dépend de l'usage final:
Si on veut permettre des recherches libres ou des renvois, il faut se mettre en mode texte, style Wikipedia; si on veut juste permettre la lecture du texte, la méthode Gallica suffit (avec des pb éventuels de droits sur les images).
On peut imaginer un système mixte comme avec certains textes de Gallica.
Vanitas vanitatum et omnia vanitas
Mes derniers livres :
Sauvez les Mots chez BoD,
Tous les chemins mènent à ROM chez BoD

Petit nouveau ! | 3 Messages

08 juin 2014, 18:23

Merci pour cette réponse,
Dans l'idée, il s'agit de tout avoir en texte, pour avoir un matériau dynamique et manipulable. L'idée serait donc de s'inspirer de Wikipedia, mais en ajoutant les fonctionnalités utiles aux chercheurs, aux lecteurs et aux étudiants.
Donc, si j'ai bien compris, Wikipedia stocke chaque page sur un fichier particulier. C'est sans doute la solution à mettre en place... Mais je crois que si aucun spécialiste n'est disposé à m'aider, je vais prendre un wiki déjà existant et y implémenter de nouvelles fonctions, ce serait peut-être plus simple.

Bjr,
Dans le cas précis de Wikipedia, le texte est dans la page livre par livre avec une page générale table des matières qui contient les liens vers les divers livres, et idem pour http://remacle.org/
Mais chez Gallica, il s'agit d'une image par page.
Tout dépend de l'usage final:
Si on veut permettre des recherches libres ou des renvois, il faut se mettre en mode texte, style Wikipedia; si on veut juste permettre la lecture du texte, la méthode Gallica suffit (avec des pb éventuels de droits sur les images).
On peut imaginer un système mixte comme avec certains textes de Gallica.