Programme Php à batch Dos ? ( eregi )

Programme Php à batch Dos ? ( eregi ) - PHP - Programmation

Marsh Posté le 06-02-2008 à 16:37:40    

Code :
  1. $Lines=@file("access.log.01.txt" );
  2. FOREACH($Lines as $k=>$v){
  3.     if(eregi("\.jpg",$v))NULL;#On ignore les stats sur les images
  4.     if(eregi("^(.*) ([0-9]+) ([0-9]+) ([^ ]+) "(.*)" "-"",$v,$t)){
  5.         $z.="$t[1] $t[2] $t[3] "$t[5]" $t[4]n";
  6.     }
  7. }
  8. #Ecriture de $z dans nouveau fichier;


Bonjour j'ai de nombreux sites sur 1and1, la conséquence directe est leur format de logs déformés que je parviens à arranger par cette opération
 
Y'aurait-il un moyen rapide et pratique de batcher cette opération en dos ?
( afin de ne pas faire ramer 1h30 un localhost sur plusieurs mois de stats, merci )  :jap:


Message édité par grosbin le 06-02-2008 à 16:38:14

---------------
Photos Panoramiques Montagnes Haute Savoie
Reply

Marsh Posté le 06-02-2008 à 16:37:40   

Reply

Marsh Posté le 06-02-2008 à 20:06:58    

Perl, python c'est mieux pour faire des moulinettes sur des fichiers. Moi, j'utilise Ruby.
 
edit :
 

Code :
  1. File.open 'access.log.01.txt', 'r' do |fic|
  2.   fic.each do |line|
  3.     if not line.match(/\.jpg$/) and matches = line.match(/^(.*) ([0-9]+) ([0-9]+) ([^ ]+) ??????/) then
  4.       puts "#{matches[1]} #{matches[2]} #{matches[3]} \"#{matches[5]}\" #{matches[4]}n";
  5.     end
  6.   end
  7. end


 
Au pire, si tu connais php, tu peux faire ton script php et l'exécuter en php-cli sur ton PC.
Sinon avec bash c'est possible aussi, parce que DOS ça m'étonnerait que ça supporte les expressions régulières, y'a le VBscript et le JScript pour batcher correctement à la place du DOS.


Message édité par czh le 06-02-2008 à 20:21:16
Reply

Marsh Posté le 22-02-2008 à 09:03:13    

Mon bidouillage actuel met 48 min pour parser 1 semaine de log, soit à peu près 300.000 lignes
 
je recherche juste the truc simple à caler en local, qui prendra moins de 2 min et qui se run sans rien installer d'autre qui soit un chemin de croix


---------------
Photos Panoramiques Montagnes Haute Savoie
Reply

Marsh Posté le 22-02-2008 à 09:19:24    

Tu pourrais juste donner un exemple de ce que tu as à la base et de ce que tu veux en sortie ?


---------------
Feedback : http://forum.hardware.fr/hfr/Achat [...] 2666_1.htm
Reply

Marsh Posté le 22-02-2008 à 10:45:58    

72.14.199.115 - - [11/Feb/2008:00:01:11 +0100] "GET /dc/rss.php HTTP/1.1" 301 248 www.bens-world.org "-" "Feedfetcher-Google; (+http://www.google.com/feedfetcher.html; 1 subscribers; feed-id=13219794659865917204)" "-"
vers
72.14.199.115 - - [11/Feb/2008:00:01:14 +0100] "GET /dc/rss.php HTTP/1.1" 301 5 "-" "Feedfetcher-Google; (+http://www.google.com/feedfetcher.html; 1 subscribers; feed-id=13219794659865917204)" bens-world.org

 

en sorte corriger les fichiers de logs 1&1, puis retirer certains hits dont on s'en tape ( les .jpg, les redirections 301 etc .. )

 

je ne sais pas si par exemple, cela peut se traiter sur notepad ++


Message édité par grosbin le 22-02-2008 à 10:47:16

---------------
Photos Panoramiques Montagnes Haute Savoie
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed