[REGEXP]Mettre en valeur des mots dans du HTML

Mettre en valeur des mots dans du HTML [REGEXP] - Algo - Programmation

Marsh Posté le 24-09-2004 à 12:08:07    

Hello :hello:
 
Le problème est le suivant :
 
Comme indiqué dans le titre, à partir d'un début de mot fourni par l'utilisateur, il faut mettre tous les mots trouvés en valeur.
 
Concrètement la mise en valeur se fait en mettant les mots trouvés dans une balise <span> avec le style qui va bien.
 
La difficulté rencontrée, c'est qu'il ne faut bien sûr pas faire de remplacement sur les noms des balises html ou leurs attributs.
 
On s'interesse donc au contenu de <body>, en faisant attention à ne pas toucher le contenu de balise du genre <script>.
 
L'application est en java 1.3 et on utilise la lib org.apache.oro.text.regex compatible perl5.
 
La question que je me pose, c'est de savoir s'il est envisageable de faire ça avec une seule expression + substitution ou s'il faut le faire en plusieurs parties (extraire le <body>, extraire les parties balises, texte et script, traiter les parties texte et reconstruire le tout  :sweat: ) ?


---------------
Laissez l'Etat dans les toilettes où vous l'avez trouvé.
Reply

Marsh Posté le 24-09-2004 à 12:08:07   

Reply

Marsh Posté le 24-09-2004 à 12:47:12    

utilise un parser html et ensuite des regexp

Reply

Marsh Posté le 07-10-2004 à 18:53:42    

si c'est des regexp compatibles perl5 et que tu comprend ce langage tu peux t'inspirer de ces modules perl qui font ce que tu cherche: (appui sur "source" tout en haut pour voir le source)
 
http://search.cpan.org/~tripie/HTM [...] ghlight.pm
 
http://search.cpan.org/~saper/Synt [...] ht/HTML.pm
 
et il faut aussi tenir compte du cas special de la balise title: le texte qu'elle contient ne doit pas etre coloré

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed