indexation de fichiers pdf, doc et xml

indexation de fichiers pdf, doc et xml - Java - Programmation

Marsh Posté le 30-05-2005 à 11:23:30    

Bonjour,
 
J'aurais besoin de trouver une bibliotheque me permettant d'indexer des fichiers pdf, doc et xml.
A partir de la recherche d'un mot, je souhaîterais trouver le nom du fichier et son chemin d'accès.
 
Une idée?
 
Merci

Reply

Marsh Posté le 30-05-2005 à 11:23:30   

Reply

Marsh Posté le 30-05-2005 à 12:08:16    

ben Lucene

Reply

Marsh Posté le 30-05-2005 à 12:09:25    

lucene avec des pdf, xml, doc?

Reply

Marsh Posté le 30-05-2005 à 12:10:48    

pour les PDF et XML, il y a ce qu'il faut, pour les .doc, je ne sais pas, mais a priori oui ca existe aussi

Reply

Marsh Posté le 30-05-2005 à 12:17:33    

(url]http://www.textmining.org[/url]
tu peux y trouver des indexer pour PDF et XML et il semblerait qu'il y ait aussi des wrapper autour de POI pour les documents word, mais j'ai pas testé.

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed