Recuperer le texte d'une page web dans un fichier texte

Recuperer le texte d'une page web dans un fichier texte - PHP - Programmation

Marsh Posté le 15-04-2004 à 10:41:53    

voila en fait c'est plus ça que je cherche a faire, ça doit être simple mais je trouve nul part :(


Message édité par checkitout le 15-04-2004 à 14:26:50
Reply

Marsh Posté le 15-04-2004 à 10:41:53   

Reply

Marsh Posté le 15-04-2004 à 10:45:36    

oui

Reply

Marsh Posté le 15-04-2004 à 10:46:32    

non


Message édité par kadreg le 15-04-2004 à 10:46:44

---------------
brisez les rêves des gens, il en restera toujours quelque chose...  -- laissez moi troller sur discu !
Reply

Marsh Posté le 15-04-2004 à 10:47:23    

à ouais mince, t'as raison, j'ai confondu avec le whitespace

Reply

Marsh Posté le 15-04-2004 à 10:47:48    

euuuh, et en VB non plus ?

Reply

Marsh Posté le 15-04-2004 à 11:00:48    

up pour un changement de langage lol jvais le faire en php en fait je pense, mais je sais toujours pas comment faire

Reply

Marsh Posté le 15-04-2004 à 11:05:29    

C'est possible avec fsockopen(), j'ai lu un article là dessus il y a longtemps.


---------------
fermez vos topics résolus avec le tag [Résolu] en fin de titre. Merci !
Reply

Marsh Posté le 15-04-2004 à 11:11:49    

Tu veux récupérer la source en PHP, c'est ça ?
 
La réponse est non.


---------------
En français, on écrit "connexion", pas "connection".
Reply

Marsh Posté le 15-04-2004 à 11:12:42    

non non je veux a partir d'un ptit code en php récup la source d'une page html

Reply

Marsh Posté le 15-04-2004 à 11:34:45    

En 30 secondes de recherche sur Google :
 
 
1 - http://www.google.fr/search?source [...] rce%22+php
2 - http://php3.de/manual/en/features.remote-files.php
 
3 -  
 
This function get HTML source from url. Follow all locations to last site. Ideal for Search Engine.
 
$url = web site to explore.
$delta = last url from location
$corto = if corto is true stop function when the tag is <body>. (This is for get metatags and title).
$complet = if complet is true return all body of page. Else return only $delta. (This is for get redirect from image: <img src=http://www.solobanner.com/index.php> )
 

Code :
  1. function GetHTML ($url, &$delta, $corto = false, $complet = true) {
  2.   $url_stuff = parse_url($url);
  3.   $fp = fsockopen ($url_stuff['host'], 80, $errno, $errstr, 30);
  4.   if (!$fp) {
  5.    exit;
  6.   } else {
  7.    $header = "GET " . $url_stuff['path'] . "?" . $url_stuff['query'] ;
  8.    $header = $header . " HTTP/1.0\r\nHost: " . $url_stuff['host'] . "\r\n\r\n";
  9.    fputs ($fp, $header);
  10.    //Separar contenido...
  11.    $header = '';
  12.    $body = '';
  13.    $act = false;
  14.    $fin = false;
  15.    while ((!feof($fp)) && !$fin) {
  16.        $line = fgets ($fp,1024);
  17.        if (!$act) {
  18.        if (strpos($line, "\r\n", 0) == 0) {
  19.            $header .= $line;
  20.            if (!$complet) $fin = true;
  21.              $act = true;
  22.            } else {
  23.              $header .= $line;
  24.            }
  25.        } else {
  26.          if ($corto) {
  27.            if (eregi ("<body([^>]*)>", $line, $o)) $fin = true;
  28.          }
  29.        if (!$fin) $body = $body . $line;
  30.        }
  31.    }
  32.      
  33.    //Seguir location...
  34.    $ret = strpos($header, "Location:", 0);
  35.      if ($ret !== false) {
  36.      $fin = strpos($header, "\r\n", $ret +9);
  37.      $nueva = substr($header, $ret+9, $fin - $ret - 9);
  38.      $body = GetHTML($nueva, $delta, $corto, $complet);
  39.      } else {
  40.      $delta = $url;
  41.    }
  42.    fclose ($fp);
  43. }
  44. return $body;
  45. }


 
Example:
$url = "http://www.elcurriculum.com/banner/go.php?from=1&to26";
echo GetHTML($url,$a,true);
echo "<br>Go to url: $a";
 
By Tryke. (Jose María Rodríguez Valls).
http://www.elcurriculum.com
http://www.solobanners.com  


---------------
En français, on écrit "connexion", pas "connection".
Reply

Marsh Posté le 15-04-2004 à 11:34:45   

Reply

Marsh Posté le 15-04-2004 à 12:59:09    

merci bien :)

Reply

Marsh Posté le 15-04-2004 à 13:57:26    

up

Reply

Marsh Posté le 15-04-2004 à 14:03:47    


 
Pourquoi faire ?


---------------
En français, on écrit "connexion", pas "connection".
Reply

Marsh Posté le 15-04-2004 à 14:06:33    

bah en fait c'est pas la source que je voudrais récupérer mais juste le texte qui est affiché sur la page web, et l'enregistrer dans un fichier :)

Reply

Marsh Posté le 15-04-2004 à 14:57:47    

up

Reply

Marsh Posté le 15-04-2004 à 16:08:15    

up

Reply

Marsh Posté le 15-04-2004 à 17:04:31    

Une fois que ta la source t'a plus qu'a enlever les balises et c'est bon. Je crois qu'il y a une fonction toute faite, mais je me souviens plus de son nom

Reply

Marsh Posté le 15-04-2004 à 17:15:01    

je voudrais juste récup le texte qui est affiché, même pas la source :)

Reply

Marsh Posté le 15-04-2004 à 17:26:16    

La réponse de M_JUL + http://fr.php.net/strip_tags (lire la thread en bas de la page)

Reply

Marsh Posté le 15-04-2004 à 18:55:38    

Sinon autre solution (pour recupérer le texte + enregistrer dans un fichier) :
* Utilise le browser texte  LYNX et :
lynx -dump "http://..." > filename
* Si tu veux faire ça via PHP :
http://fr.php.net/manual/fr/ref.exec.php

Reply

Marsh Posté le 15-04-2004 à 20:43:47    

Ouais, masi faut avoir lynx en localhost  :o

Reply

Marsh Posté le    

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed