Récupérer les données d'un site. - Codes et scripts - Linux et OS Alternatifs
Marsh Posté le 24-04-2004 à 12:24:17
un dump avec lynx ?
Marsh Posté le 25-04-2004 à 17:49:18
Merci pour vos réponses.
Un wget semble me convenir.
En effet, je retrouve après la commande wget www.boursorama.com un fichier index.html.
Dans ce fichier ce trouve ces valeurs :
...
<TD NOWRAP align="LEFT"> <A target="_top" HREF="/cours.phtml?symbole=1rPCAC">CAC 40</A></TD>
<TD NOWRAP align="right">3811.43(c) </TD>
...
Dans ces lignes, l'information qui m'intéresse est le chiffre "3811.43"
Mais comment l'extraire via un grep ?
La seule particularité de cette ligne est un chiffre qui varie. (Tout le reste de cette ligne se retrouve plusieurs fois dans le fichier index.html)
Marsh Posté le 25-07-2005 à 07:16:51
et comment tu fais si tu veux récupérer la valeurs de ta liste ce qui implique que tu soit identifié? je sèche là-dessus ...
Marsh Posté le 25-07-2005 à 08:58:30
Salut !
J'avais fais un truc comme ça en perl pour récupérer une liste d'entreprise sur le site de la CCI.
Voir ces liens :
http://wwwsearch.sourceforge.net/mechanize/
http://www.perl.com/pub/a/2003/01/22/mechanize.html
http://articles.mongueurs.net/maga [...] mag58.html
Marsh Posté le 25-07-2005 à 09:52:14
est ce que le numero de la ligne change ??? oui, c'est crade, masi ca peut marcher... du moins jusqu'a ce que le site change un tout petit peu...
Marsh Posté le 24-04-2004 à 09:54:41
Bonjour à tous.
J'ai encore besoin de votre précieuse aide pour réaliser un script.
Je voudrais récupérer dans un fichier des données se trouvant sur le site www.boursorama.com.
Par exemple, je voudrais récupérer les valeur du CAC40. Si je regarde les sources de la page, je retrouve ceci :
<TD><SELECT name="graph" onchange="document.location.href='?graph=' + this.options[this.selectedIndex].value">
<option value="1rPCAC">CAC 40</option>
...
</SELECT></TD>
Y a-t-il moyen d'interroger le site via ligne de commande et récupérer les informations dans un fichier ?
Merci de votre aide.