Python : UrlLib et les méta - Python - Programmation
Marsh Posté le 21-12-2005 à 19:10:58
urllister.py par exemple ?
http://diveintopython.org/html_pro [...] _data.html
Marsh Posté le 21-12-2005 à 23:52:33
Ouai j'avais dja vu mais la c'est expliquer pour les liens...
Y a pas un truc tout pres tout joli pour les métas ?
Marsh Posté le 22-12-2005 à 08:04:37
récupérer le fichier puis un coup de regexp sur meta name='keywords' et
meta name='description' est pas très compliqué ... qu'est ce qui te bloque ?
Marsh Posté le 24-12-2005 à 13:22:06
Non c juste que je débute et je connais pas encore (loin de la) toutes les possibilités.
Et je dois avouer que je manque de motivation mais bon... c'est un petit boulot bidon pour la rentrée.
Merci a toi.
Marsh Posté le 28-12-2005 à 23:31:41
Tu récupères la page (d'ailleurs normalement on est censé utiliser urllib2, pas urllib), tu parses le fichier ligne par ligne et tu conserves chaque ligne pour laquelle ligne.strip().lower.startswith("<meta" ) est vrai et tu dégages les autres
Tu peux même coller ça dans une fonction et utiliser filter() sur une liste de lignes, et c'est terminé
Marsh Posté le 21-12-2005 à 17:29:27
Slt,
Je dois faire un petit script pour demain qui me permettrait d'extraire les métas d'une page (url a rentrer). Je débute malheureusement en Python et je n'arrive pas a trouver la méthode avec UrlLib.
Ca doit etre tout con dnoc si quelqu'un pouvait me sauver... surtout quelques jours avant Noel...
Thx