Python : UrlLib et les méta

Python : UrlLib et les méta - Python - Programmation

Marsh Posté le 21-12-2005 à 17:29:27    

Slt,
 
Je dois faire un petit script pour demain qui me permettrait d'extraire les métas d'une page (url a rentrer). Je débute malheureusement en Python et je n'arrive pas a trouver la méthode avec UrlLib.
 
Ca doit etre tout con dnoc si quelqu'un pouvait me sauver... surtout quelques jours avant Noel...
 
Thx

Reply

Marsh Posté le 21-12-2005 à 17:29:27   

Reply

Marsh Posté le 21-12-2005 à 19:10:58    

Reply

Marsh Posté le 21-12-2005 à 23:52:33    

Ouai j'avais dja vu mais la c'est expliquer pour les liens...
Y a pas un truc tout pres tout joli pour les métas ? :P

Reply

Marsh Posté le 22-12-2005 à 08:04:37    

récupérer le fichier puis un coup de regexp sur meta name='keywords' et  
meta name='description' est pas très compliqué ... qu'est ce qui te bloque ?

Reply

Marsh Posté le 24-12-2005 à 13:22:06    

Non c juste que je débute et je connais pas encore (loin de la) toutes les possibilités.
Et je dois avouer que je manque de motivation mais bon... c'est un petit boulot bidon pour la rentrée.
Merci a toi.

Reply

Marsh Posté le 28-12-2005 à 23:31:41    

[:petrus75]
 
Tu récupères la page (d'ailleurs normalement on est censé utiliser urllib2, pas urllib), tu parses le fichier ligne par ligne et tu conserves chaque ligne pour laquelle ligne.strip().lower.startswith("<meta" ) est vrai et tu dégages les autres [:petrus75]
 
Tu peux même coller ça dans une fonction et utiliser filter() sur une liste de lignes, et c'est terminé [:petrus75]

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed