[PostgreSQL - Tsearch2] Configuration du dictionnaire

Configuration du dictionnaire [PostgreSQL - Tsearch2] - SQL/NoSQL - Programmation

Marsh Posté le 04-10-2006 à 20:18:59    

Salut a tous.
Je travaille depuis 2mois maintenant avec PostGreSQL et je me lance maintenant dans la recherche par mot clef (avec indexation par Tsearch2).
Pour l'instant Tsearch 2 est installe chez moi avec la configuration de base (ma base est en UTF8) mais voila ce qu'il me faudrait au final :
- un dictionnaire francais (un bon si possible car j'ai entendu partout que le dictionnaire Ispell avait pas mal de pb en francais)
- un dictionnaire anglais (et oui c'est un site multi-lingues...)
- la recherche doit de plus pouvoir chercher des noms de marques si possible meme si la marque est mal orthographiee (utilisation de soundex??)
 
Auriez-vous sous la main des documentations bien faites me permettant de configurer tout ca comme il me faut? ou des pistes sur lesquelles je devrais me lancer?
J'ai deja fait pas mal de recherches mais j'avoue que je suis perdu...
 
 
Merci d'avance

Reply

Marsh Posté le 04-10-2006 à 20:18:59   

Reply

Marsh Posté le 05-10-2006 à 10:07:23    

je connais pas du tout tsearch.
 
mais avec pg y'a certainement une indexation littérale qui existe... et à ce moment, tu peux te passer de dictionnaire.
le dico ne serait utile à ce moment que si pg permet de rechercher les synonymes/antonymes, ou le même mot dans une autre langue, etc.

Reply

Marsh Posté le 05-10-2006 à 15:53:41    

si je veux utiliser tsearch2 avec des dicos c parce que ca permet par exemple que "chercheur", "chercheuse", "chercheurs" soit indexes pareil...

Reply

Marsh Posté le 05-10-2006 à 16:57:48    

avec un index de "texte intégral", ça marche pareil, y'a juste un truc à rajouter dans la requête afin de lui dire "même racine que"

Reply

Marsh Posté le 05-10-2006 à 19:54:40    

ya pas d'indexage Texte Integral sous postgresql en natif. C'est tsearch qui l'implemente mais il faut le configurer.
En gros voila comment je voudrais que marche mon indexage tsearch (mais je sais pas comment faire), pour chaque mot :
- si moins de 3 lettres ou si stop word => on ignone
- suppression des accents
- calcul du soundex (jai trouve un contrib postgresql qui le fait)
 
Qqn maitrise-t-il assez tsearch pour pouvoir maider?
 
Merci

Reply

Marsh Posté le 29-01-2007 à 05:34:06    

Bonjour à tous!
 
Je me demandais s'il y a avait des développements sur ce front.  Moi aussi je suis à la recherche d'une procédure pour supprimer les accents, et, si possible, d'un bon dictionnaire français pour tsearch2.

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed