par
moogli » 23 déc. 2010, 14:00
l'installation est fonctionnelle XML et CSV ?
si oui je pense que ce n'est qu'un soucis de configuration
quand je lis
Indexer un jeu de données en exemple
La distribution de Solr inclue un jeu de documents de test pour l’indexation. Il est possible de les indexer au moyen du package java post.jar.
Ouvrir une console et se placer dans le répertoire « d:\solr\apache-solr\example\exampledocs »
Avec Jetty, lancer la commande :
java -jar post.jar *.xml
Avec Tomcat, lancer la commande :
java -Durl=
http://localhost:8080/solr/update -jar post.jar *.xml
Pour obtenir la liste de toutes les options de cet utilitaire, la commande est :
java -jar post.jar -help
je me dit qu'en remplaçant *.xml par *.doc et consor ça devrait fonctionner ?
ensuite pour lucene il indiqué que
Si le texte qui est à indexé est contenu dans des fichiers Excel, Word, PDF ou HTML, c’est de votre ressort d’en extraire de contenu textuel qui sera indexé. Il est possible d’utiliser par exemple pdftotext pour les fichiers PDF et Antiword pour les fichiers Microsoft Word.
Perso je te conseil de voir sur les forum dédié ) solr comment le configurer correctement pour indexer les fichier qui t’intéresse dans un premier temps et d'ensuite voir pour l'utilisation avec php.
Pour l'utilisation avec php il y a deja la doc
http://php.net/solr
edit : le coté pecl por php
http://pecl.php.net/package/solr
@+
l'installation est fonctionnelle XML et CSV ?
si oui je pense que ce n'est qu'un soucis de configuration
quand je lis
[quote]Indexer un jeu de données en exemple
La distribution de Solr inclue un jeu de documents de test pour l’indexation. Il est possible de les indexer au moyen du package java post.jar.
Ouvrir une console et se placer dans le répertoire « d:\solr\apache-solr\example\exampledocs »
Avec Jetty, lancer la commande :
java -jar post.jar *.xml
Avec Tomcat, lancer la commande :
java -Durl=http://localhost:8080/solr/update -jar post.jar *.xml
Pour obtenir la liste de toutes les options de cet utilitaire, la commande est :
java -jar post.jar -help [/quote]
je me dit qu'en remplaçant *.xml par *.doc et consor ça devrait fonctionner ?
ensuite pour lucene il indiqué que
[quote]
Si le texte qui est à indexé est contenu dans des fichiers Excel, Word, PDF ou HTML, c’est de votre ressort d’en extraire de contenu textuel qui sera indexé. Il est possible d’utiliser par exemple pdftotext pour les fichiers PDF et Antiword pour les fichiers Microsoft Word.[/quote]
Perso je te conseil de voir sur les forum dédié ) solr comment le configurer correctement pour indexer les fichier qui t’intéresse dans un premier temps et d'ensuite voir pour l'utilisation avec php.
Pour l'utilisation avec php il y a deja la doc [url]http://php.net/solr[/url]
edit : le coté pecl por php [url]http://pecl.php.net/package/solr[/url]
@+