Comment faire un métamoteur?

Comment faire un métamoteur? - PHP - Programmation

Marsh Posté le 02-04-2008 à 01:11:06    

Bonjour,
 
Je m'intéresse depuis très peu aux méta moteurs en php. J'ai beau me débrouiller en PHP, la je ne vois vraiment pas comment fonctionnent les méta moteurs  [:axlrose]. C'est plutot l'aspect algorithme (s'il y en a un) de parcours des pages (de google, ou même des sites indexés par google) que je n'arrive pas à imaginer.
J'ai parlé avec quelqu'un aujourd'hui qui m'a donné une piste avec la fonction php file_get_quelque_chose. Une ptite recherche ne m'a donné que la fonction file_get_contents, mais je ne sais pas si l'on peut obtenir quelque chose de satisfaisant avec ca.
 
Si un connaisseur pouvait éclairer ma lanterne, ce serait très sympa :)


---------------
Direct-download.com, le moteur de recherche pour Mega
Reply

Marsh Posté le 02-04-2008 à 01:11:06   

Reply

Marsh Posté le 02-04-2008 à 05:26:52    

file_get_contents() te permet de récupérer le contenu d'un fichier et peut accepter une url comme paramètre moyennant la config adéquat de php ;)
 
Après une fois que tu as une page à toi de voir ce que tu veux faire de son contenu ;)

Reply

Marsh Posté le 02-04-2008 à 12:47:46    

Oui j'ai réussi a récupérer une page de résultats de google (la 1ere) avec cette fonction.
Le problème après c'est de parcourir les résultats. Quelque chose me dit qu'il y a peut-être de la récursivité dans l'algorithme non?


---------------
Direct-download.com, le moteur de recherche pour Mega
Reply

Marsh Posté le 02-04-2008 à 14:36:10    

Alors ça après...
 
Ca dépend de ce que tu veux et avant de refaire un google je te souhaite bien du courage :D

Reply

Marsh Posté le 02-04-2008 à 14:38:06    

welcominh a écrit :

Oui j'ai réussi a récupérer une page de résultats de google (la 1ere) avec cette fonction.
Le problème après c'est de parcourir les résultats. Quelque chose me dit qu'il y a peut-être de la récursivité dans l'algorithme non?


 
pour parcourir les resultats, regarde du cote des expression regulieres pour extraire les liens qui ont une gueule précise  
 
sinon, tu peux regarder du cote des web services que google fourni, ce sera plus compliqué a mettre en oeuvre au debut, mais tellement plus fiable


---------------

Reply

Marsh Posté le 02-04-2008 à 23:00:10    

J'ai déjà regardé un peu les expressions régulières pour extraire des liens précis des pages. J'en aurai besoin c'est sur. Je n'essaie pas de refaire google comme le pense leflos5, j'essaie juste de cibler un type de résultat précis. Ex: des vidéos avi ou autre.
Pour le parcours, je pensais passer par file_get_contents en lui passant l'url des pages de résultats de google: il y a un seul paramètre qui change je crois, celui du numéro du 1er résultat de la page. Le probleme c'est le nombre de pages pour une recherche je ne le connais pas.


Message édité par welcominh le 02-04-2008 à 23:00:20

---------------
Direct-download.com, le moteur de recherche pour Mega
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed