Spambot, contenu html et protection

Spambot, contenu html et protection - Sécurité - Windows & Software

Marsh Posté le 29-10-2005 à 13:32:12    

Salut à tous
 
je me posais un question :
ayant un site perso, qui met à disposition un contact sous forme d'adr mail, et bien sur j'imagine ben que tt les spambot du monde s'amusent à récuperer qq infos par ci par là histoire de bien nous emmerder par la suite...
Oui mais les quels exactement ? ou plus précisement, qu'est-ce qui est "parsé" dans une page html ?
 
par exemple :

Code :
  1. <a href="mailto:adresse.mail@domaine.com" title="envoyer mail à adresse.mail@domaine.com">adresse.mail@domaine.com</a>


 
Qu'est que le spambot cherche la dedans ?
le contenu du "href (via detection du "mailto:" ) ? le contenu de l'attribut "title" ou tt simplement tt ce qui ressemble de pres ou de loin à une adresse mail (via une expression reguliere par exemple) ?
 
Merci de m'apporter vos lumières :jap:


---------------
We deserve everything that's coming...
Reply

Marsh Posté le 29-10-2005 à 13:32:12   

Reply

Marsh Posté le 01-11-2005 à 10:00:43    

Effectivement, souvent, il 'crawle' les sites à la recherche de ce type d'information. Et après, tu as le droit à du spam.... :(

Reply

Marsh Posté le 01-11-2005 à 10:03:07    

Il est possible d'utiliser un petit script en Javascript pour oculter l'adresse email.
 
http://www.caspam.org/
 
Il est clair que ca fait bcp de caractères pour juste une adresse email, mais c'est quand même plus prudent.

Reply

Marsh Posté le 03-11-2005 à 11:44:28    

merci de vos réponses :jap:
 
perso j'ai mis ca en place, en partant du principe qu'une adresse mail visible sur un site c'est le mal, et ceci quel que soit son emplacement :)
 
vla du code en PHP :
 

Code :
  1. // ***********************************
  2. // retourne un tableau avec 2 versions encodées d'une adr mail:
  3. //    $encoded: pour les "mailto:" -> adr mail encodées en hexa (visible par les browser)
  4. //    $modded: pour les attributs alt et title, "mon.mail@domaine.com" devient "mon(DOT)mail(AT)domaine(DOT)com"
  5. function scrambleMailAdr ($adrmail)
  6. {
  7.  $encoded = bin2hex ($adrmail);
  8.  $encoded = chunk_split ($encoded, 2, '%');
  9.  $encoded = '%' . substr ($encoded, 0, strlen ($encoded) - 1);
  10.  $modded = $adrmail;
  11.  $modded = str_replace ("@", "(AT)", $modded);
  12.  $modded = str_replace (".", "(DOT)", $modded);
  13.  return array ($encoded, $modded);
  14. }
  15. // *******************************
  16. function mailEncode ($adrmail, $repl)
  17. {
  18.  $fakeadrmail= scrambleMailAdr ($adrmail);
  19.  return sprintf ($repl, $fakeadrmail[0], $fakeadrmail[1], $adrmail);
  20. }
  21. // email2img.php est un simple script générant une image representant l'adr mail passé en param
  22. $html = '<a href="mailto:%s" title="envoyer un mail à %s"><img align="textmiddle" src="php/email2img.php?m=%s"></a>';
  23. print (mailEncode ("blabla@domaine.com", $html));


 
ce qui va générer un truc comme ca (sachant que la seule adr mail visible est passée en param dans le script email2img.php, et donc executé sur le serveur ce qui la rend "invisible" par les visiteurs et autres bots...):


<a href="mailto:%62%6c%61%62%6c%61%40%64%6f%6d%61%69%6e%65%2e%63%6f%6d" title="envoyer un mail à blabla(AT)domaine(DOT)com"><img align="textmiddle" src="php/email.php?m=blabla@domaine.com"></a>


 
 
Voila, si ca peut servir à qq c cool :hello:


---------------
We deserve everything that's coming...
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed