Programme de recherche de liens morts

Programme de recherche de liens morts - C - Programmation

Marsh Posté le 09-04-2008 à 13:04:42    

Bonjour !  :hello:  
 
Je suis en première année d'école d'ingénieur, donc encore assez expérimenté côté programmation, et on m'a demandé de créer un programme qui détecte les liens morts dans une arborescence locale de pages HTML...
 
Seulement voilà : je ne sais pas comment m'y prendre pour détecter si le lien est mort ou pas. Le prof nous a vaguement parlé d'un code retour, en faisant des recherches sur Google j'ai trouvé une référence à la fonction "GET HTML", mais aucune explication concrète.
 
Quelqu'un aurait-il une piste ?
 
Merci beaucoup !
 
 :jap:

Reply

Marsh Posté le 09-04-2008 à 13:04:42   

Reply

Marsh Posté le 09-04-2008 à 13:15:38    

bah si le lien marche pas la page existe pas, ca renvoie un 404

Reply

Marsh Posté le 09-04-2008 à 13:17:44    

oui mais quelle est la fonction qui renvoie un 404 ?
 
Une fonction qui "cliquerait" virtuellement sur un lien quoi...

Reply

Marsh Posté le 09-04-2008 à 13:22:27    

ah! regarde du coter de wget (les sources doivent etre dispo). En gros, tu envoie un en-tete HTTP GET sur l'url via une connection réseau. Le retour de cette conenction contient un paquet que tu parses pr trovuer le code d'erreur eventuel. Y a des bibliothèques qui gérent tt seule ces hsitories de conenction.

Reply

Marsh Posté le 09-04-2008 à 13:25:13    

Dur... Mais merci pour ton aide ! Je vais essayer.
 
Il ne faut pas qu'on utilise de librairie, ce serait trop facile...
 
:jap:

Reply

Marsh Posté le 09-04-2008 à 17:39:23    

j'ai trouvéééééééééééé !
 
$ GET html -d htp://www.google.fr   ===> fausse adresse : code retour = 1
$ echo $?
1
$ GET html -d http://www.google.fr  ===> bonne adresse : code retour = 0
$ echo $?
0
 
 
youhouuuu merci Joel F de m'avoir indiqué la voix...  :jap:

Reply

Marsh Posté le 09-04-2008 à 18:03:48    

essaye avec des adresses bien formés mais inexistantes. genre http://masiquellebecassecellela.zub

Reply

Marsh Posté le 10-04-2008 à 10:51:01    

bouldouman a écrit :

j'ai trouvéééééééééééé !
 
$ GET html -d htp://www.google.fr   ===> fausse adresse : code retour = 1
$ echo $?
1
$ GET html -d http://www.google.fr  ===> bonne adresse : code retour = 0
$ echo $?
0
 
 
youhouuuu merci Joel F de m'avoir indiqué la voix...  :jap:


Je ne suis pas sûr que ça corresponde vraiment à ce qui t'a été demandé !
 
Dans un premier temps, tu devrais étudier le protocole HTTP. Les bases du protocole ne sont pas très compliquées, et tu devrais apréhender plus facilement ton exercice.


---------------
Kao ..98 - Uplay (R6S) : kao98.7.62x39 - Origin (BF4, BF1) : kntkao98
Reply

Marsh Posté le 10-04-2008 à 14:35:47    

Joel F a écrit :

essaye avec des adresses bien formés mais inexistantes. genre http://masiquellebecassecellela.zub


 
 
Ca marche... J'obtiens bien un code d'erreur avec une adresse inexistante.  
 
[:ach_lette]

Reply

Marsh Posté le 10-04-2008 à 14:37:16    

kao98 a écrit :


Je ne suis pas sûr que ça corresponde vraiment à ce qui t'a été demandé !
 
Dans un premier temps, tu devrais étudier le protocole HTTP. Les bases du protocole ne sont pas très compliquées, et tu devrais apréhender plus facilement ton exercice.


 
Euh... pourtant je pense que ça correspond bien ! Ca me détecte les liens morts, après il suffit d'utiliser cela dans le programme, en détectant le code retour, et rouleeeez !
 
[:akilae]
 
Non ?  :whistle:


Message édité par bouldouman le 10-04-2008 à 14:50:46
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed