Extraire une ligne d'une page web vers un fichier texte - HTML/CSS - Programmation
Marsh Posté le 05-04-2010 à 15:21:29
wget + grep + cut et/ou sed, le tout avec un cron et le tour est joué.
Marsh Posté le 05-04-2010 à 17:05:43
merci de ta réponse, mais je n'ai jamais touché a UNIX... donc la je ne comprend pas grand chose. Tu pourrais expliquer comment faire stp?
Marsh Posté le 05-04-2010 à 20:21:14
Fais une recherche sur ce que fait chacun de ces programmes. Il te faut 1 ligne pour faire marcher chacun! Procède avec un de ces utilitaires à la fois.
Commence par wget pour télécharger la page... Puis grep pour dénicher la ligne de ton premier post... C'est excessivement aisé.
Marsh Posté le 06-04-2010 à 19:15:10
Ok, j'ai vu globalement a quoi ca servait, je regarderai + en détail ce weekend.
Merci!
Marsh Posté le 06-04-2010 à 20:23:55
Mais c'est dans super longtemps le week-end?!
Marsh Posté le 10-04-2010 à 20:32:21
non c'est maintenant le weekend
bon j'ai cherché un peu :
wget ca marche, j'obtient le fichier index.html
mais deja grep je trouve pas la bonne commande, donc j'imagine meme pas pour tout faire fonctionner en meme temps...
désolé si ca parait simple pour toi, j'ai du mal
Marsh Posté le 17-04-2010 à 19:05:37
Ah heu sorry, c'est toujours d'actualité après 1 semaine?
Marsh Posté le 18-04-2010 à 00:24:26
oui, c'est vrai que j'y ai pas beaucoup regardé depuis, si ce n'est que j'ai vu que grep et sed fonctionnent ensemble...
j'ai fait des essais avec cette commande pour essayer de m'afficher le texte entre les balises <h1> et </h1> :
Code :
|
... mais j'obtient des erreurs du genre "caracteres inutiles"
en tous cas si tu peux m'aider ca serait sympa.
bon we
Marsh Posté le 18-04-2010 à 10:34:25
Avec grep tout seul :
Citation : -o, --only-matching |
On a :
karkass:~ sircam$ cat essai.txt |
Le .* représente n'importe quelle suite de caractères
Marsh Posté le 18-04-2010 à 16:45:49
merci de ta réponse, j'ai réussi a obtenir ca :
grep -o "current-song.*</div>" index.html |
apres il faut encore ne conserver que le texte a l'interieur. Et comment faire pour l'inscrire dans un fichier txt ?
merci encore
Marsh Posté le 25-04-2010 à 15:38:23
Bon, j'ai reussi a l'inscrire vers un fichier txt :
song">BOBBY WOMACK - ACROSS 110TH STREET </div></div>< |
Pour l'execution et la repetition de la tache j'ai trouvé comment faire, donc il ne reste plus qu'a supprimer les balises pour faire + propre...
Marsh Posté le 05-04-2010 à 15:01:40
Bonjour,
je voudrais savoir s'il est possible d'extraire une ligne d'une page web vers un fichier texte... je m'explique :
J'ecoute une radio sur internet, et les titres diffusés en direct s'affichent en haut sur le site (site en question : http://urgent.fm/). Comme je ne suis pas toujours devant mon écran, je souhaiterais créer une playlist des titres diffusés dans un fichier texte.
Donc il faudrait extraire la ligne de la page web, puis l'enregistrer chaque minute (avec l'heure d'enregistrement si possible) vers le fichier .txt.
En regardant le code source de la page j'ai vu que le titre etait entre balises, je ne sais pas si ca peut servir.
Voila, c'est un peu compliqué, je ne sais pas du tout avec quels outils il est possible de le faire. Je n'ai que quelques notions de programmation.
Merci d'avance !