Sujet: Recupéré code source page file_get_contents()

Sujet: Recupéré code source page file_get_contents() - PHP - Programmation

Marsh Posté le 10-04-2010 à 11:11:02    

Bonjour à tous !
 
J'aimerai récupéré une parti qui m'interresse sur un site a partir de cette fonction:
file_get_contents($url);
 
Mon script foncionne dans 70% des cas, le problème est quand le site charge avec du javascript ou du ajax une partie du site que je veux récupéré...  
 
Je n'arrive plus a l'extraire...
 
Auriez vous une explication?  
Je prends par exemple ce site:
http://www.jeuxvideo.fr/jeux/assassin-s-creed-2/  
--> Par defaut il va charger la page pour XBOX360.
 
Mais imaginons que je veuille récupéré la page pour PC il faut alors que je tape:
http://www.jeuxvideo.fr/jeux/assassin-s-creed-2/#pc
 
Et on va voir alors que en bas a droite sur la Fiche Technique du jeu se chargé dynamiquement...
 
Du coup je repose ma question auriez vous une technique pour récupéré le code charger ?  
 
Merci d'avance à tous pour votre aide

Reply

Marsh Posté le 10-04-2010 à 11:11:02   

Reply

Marsh Posté le 10-04-2010 à 11:35:30    

Pour faire la function qu'est utilisé sur ce site là, J'utiliserais la function PHP $_GET. Il y a des information utile ici
 
http://votresite.com/jeu montrarait le page xbox par exemple. Mais http://votresite.com/jeu?console=pc montrerais le page pc.


---------------
J'apprends parler en français alors je ferai des erreurs. S'il vous plaît corrigez-moi :)
Reply

Marsh Posté le 10-04-2010 à 11:44:30    

Hmm oue je suis plutot d'accord avec toi la dessus.  
 
Mais ma question porte plus sur comment montrer la page PC c'est a dire comment la récupéré sachant que une partie de la page se charge aprés.
 
Si je devais faire un schéma de la timeline de chargement se serait ca
 
--> Site
-->#Xbox360(par defaut)
------------------------>#PC (quelques secondes aprés)
 
Alors que au moment ou je fais:
 
file_get_contents(http://www.jeuxvideo.fr/jeux/assassin-s-creed-2/#pc);
 
la fonction es 'trop' rapide et récupère la première partie c'est à dire:
--> Site
-->#Xbox360(par defaut)
 
Alors que je voudrais récupéré:
 
--> Site
------------------------>#PC (quelques secondes aprés)
 
Je sais pas si j'ai été plus clair comme ca ?

Reply

Marsh Posté le 10-04-2010 à 12:39:46    

Utilisez un Javascript retard?


---------------
J'apprends parler en français alors je ferai des erreurs. S'il vous plaît corrigez-moi :)
Reply

Marsh Posté le 10-04-2010 à 13:26:23    

Va voir Ici parceque la t'inverse tout :/

Reply

Marsh Posté le 10-04-2010 à 15:36:48    

Quel est la problème? Ce n'est pas une bonne idée pour moi de parler ici?
 
Qu'est-ce que j'ai fait de mal?


---------------
J'apprends parler en français alors je ferai des erreurs. S'il vous plaît corrigez-moi :)
Reply

Marsh Posté le 10-04-2010 à 22:08:42    

merci de pas sortir du sujet s'il vous plait...

Reply

Marsh Posté le 11-04-2010 à 00:31:59    

en gros tu cherche à récuperer un site avec son contenu standard et son contenu ajax-loaded ?
 
Vas falloir que t'identifie, les evenements JS lancés, ou carrement les requetes HTTP balancés pour les dupliquer à ta guise et faire du file_get_contents dessus
 
Mais bon dans le genre crado et nawak c'est parfait. Ca pue le script qui marchera 2 semaines et qui tombera à la première update de leur site.


---------------
App Android NextGP - Calendrier, Notifications pour 12 sports meca : Playstore - TU
Reply

Marsh Posté le 11-04-2010 à 10:10:51    

Oui exact bixibu mais le but n'est pas que se script soit fonctionnel pendant des années mais juste quelques semaines le temps de récupérer des infos et les stocker dans une base de donnée.

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed