Un aspirateur de site ? - Logiciels - Linux et OS Alternatifs
Marsh Posté le 19-04-2003 à 10:56:57
Putain c'est génial ce truc ! Par contre j'ai pas trouvé d'option pour ne pas lui dire de sortir du nom de domaine du site qu'on aspire. C'est normal ou j'ai mal cherché ?
Marsh Posté le 19-04-2003 à 11:18:57
mal cherché
-m = mirror, en principe il va pas trop loin...
Marsh Posté le 19-04-2003 à 11:22:15
et aussi -np (no parent) pour lui dire de ne pas remonter dans l'arborescence du site s'il y a des liens qui y mène.
Marsh Posté le 24-04-2003 à 21:56:03
Il y a httrack, très efficace.
et son interface graphique sous KDE, khttrack.
Marsh Posté le 10-02-2005 à 10:23:42
il y a également une extension Firefox :
Spiderzilla.
Pas testé.
khttrack à l'air très bien. Je vais l'installer.
Marsh Posté le 10-02-2005 à 10:36:37
httrack forever !
Marsh Posté le 21-02-2005 à 15:22:24
Bonjour ,
Suite à vos échanges, j'ai utiliser HTTrack pour aspirer un site mais il n'a que partiellement répondu à mon attente .
En effet, ce site dispose de 2 "portails". Un tout public et un avec un accès réservé (login + mot de passe).
Le téléchargement de la 1ère partie est très bien mais le téléchargement de la seconde partie ne se fait pas.
Je précise que je rentre le login et le mot de passe lors du choix de l'URL à télécharger dans HTTrack mais rien n'y fait.
Comment dois-je procéder pour accéder hors connexion à la partie "réservé" ?
Je sais que certains sites se protègent contre les aspirateurs, existe-t'il un procédé pour contourner ces protections ?
Merci de votre aide.
Johann
Marsh Posté le 21-02-2005 à 20:36:17
IQJG a écrit : Bonjour , |
le meilleur des meilleurs des aspirateurs, c'est inconstestablement wget. Ce qui est amusant j'ai voulu le telecharger à mon taf pour tester la connexion du firewall, et bien je n'ai meme pas pu le dezipper. Panda antivirus, le considerer comme un outil de hacker. Sur ce point il a pas tout a faire tort. Ce logiciel, c''est une brute.
Pour faire passer le login et le pass, je conseille de le faire par l'adresse (http://monlogin:monpass@monurl.com) et non pas par les option --password et --login (ou un truc dans le ganre)
Marsh Posté le 22-02-2005 à 08:17:48
[quote=639759,0,11,68046]Ben c po bien ça de contourner les protections ^^[/quote]
Ok mais ça pas avancer le problème...
Marsh Posté le 22-02-2005 à 08:18:52
[quote=639917,0,12,54005]le meilleur des meilleurs des aspirateurs, c'est inconstestablement wget. Ce qui est amusant j'ai voulu le telecharger à mon taf pour tester la connexion du firewall, et bien je n'ai meme pas pu le dezipper. Panda antivirus, le considerer comme un outil de hacker. Sur ce point il a pas tout a faire tort. Ce logiciel, c''est une brute.
Pour faire passer le login et le pass, je conseille de le faire par l'adresse (http://monlogin:monpass@monurl.com) et non pas par les option --password et --login (ou un truc dans le ganre)[/quote]
Je vais essayer Wget.
Merci.
Marsh Posté le 19-04-2003 à 10:41:31
Bonjour je cherche un soft (si possible dispo en paquet Debian) pour "aspirer" les sites. Si en plus ça pouvai avoir une GUI...