Récupérer les données d'un site.

Marsh Posté le 24-04-2004 à 09:54:41

Bonjour à tous.

J'ai encore besoin de votre précieuse aide pour réaliser un script.

Je voudrais récupérer dans un fichier des données se trouvant sur le site www.boursorama.com.

Par exemple, je voudrais récupérer les valeur du CAC40. Si je regarde les sources de la page, je retrouve ceci :

<TD><SELECT name="graph" onchange="document.location.href='?graph=' + this.options[this.selectedIndex].value">
<option value="1rPCAC">CAC 40</option>
...
</SELECT></TD>

Y a-t-il moyen d'interroger le site via ligne de commande et récupérer les informations dans un fichier ?

Merci de votre aide.

Reply

Marsh Posté le 24-04-2004 à 09:54:41

Reply

Marsh Posté le 24-04-2004 à 12:24:17

un dump avec lynx ?

---------------
Celui qui pose une question est idiot 5 minutes. Celui qui n'en pose pas le reste toute sa vie. | Membre du grand complot pharmaceutico-médico-scientifico-judéo-maçonnique.

Reply

Marsh Posté le 24-04-2004 à 12:49:17

ou un wget pipé grep =)

Reply

Marsh Posté le 25-04-2004 à 17:49:18

Merci pour vos réponses.

Un wget semble me convenir.

En effet, je retrouve après la commande wget www.boursorama.com un fichier index.html.

Dans ce fichier ce trouve ces valeurs :
...
<TD NOWRAP align="LEFT"> <A target="_top" HREF="/cours.phtml?symbole=1rPCAC">CAC 40</A></TD>
<TD NOWRAP align="right">3811.43(c) </TD>
...

Dans ces lignes, l'information qui m'intéresse est le chiffre "3811.43"

Mais comment l'extraire via un grep ?

La seule particularité de cette ligne est un chiffre qui varie. (Tout le reste de cette ligne se retrouve plusieurs fois dans le fichier index.html)

Reply

Marsh Posté le 25-07-2005 à 07:16:51

et comment tu fais si tu veux récupérer la valeurs de ta liste ce qui implique que tu soit identifié? je sèche là-dessus ...

Reply

Marsh Posté le 25-07-2005 à 08:58:30

Salut !

J'avais fais un truc comme ça en perl pour récupérer une liste d'entreprise sur le site de la CCI.
Voir ces liens :
http://wwwsearch.sourceforge.net/mechanize/
http://www.perl.com/pub/a/2003/01/22/mechanize.html
http://articles.mongueurs.net/maga [...] mag58.html

Reply

Marsh Posté le 25-07-2005 à 09:52:14

est ce que le numero de la ligne change ??? oui, c'est crade, masi ca peut marcher... du moins jusqu'a ce que le site change un tout petit peu...

Reply

Récupérer les données d'un site.

Sujets relatifs:

Leave a Replay