reconnaissance de texte dans un fichier image

reconnaissance de texte dans un fichier image - Divers - Programmation

Marsh Posté le 19-06-2007 à 09:39:08    

Bonjour à tous,
 
Je dois chercher du texte dans de nombreux fichiers tifs de plusieurs pages chacun.
Un par un, j'ouvre le fichier, je fais edition puis rechercher. Là j'ai un message me disant "Microsoft Office Document Imaging doit reconnaitre le texte de ce document avant que vous puissiez executer cette opération". Il me convertit donc mon fichier puis me demande quel mot je recherche.
Tout ça est tres bien, mais vu le nombre impressionnant de fichier que je dois traiter, je cherche à faire un programme me permettant d'aller ouvrir les fichier et de faire ce traitement automatiquement...
 
Merci par avance de votre aide!
 
Je travaille sous Windows XP.

Reply

Marsh Posté le 19-06-2007 à 09:39:08   

Reply

Marsh Posté le 19-06-2007 à 11:28:14    

là, comem ça, simpleme,t, je dirais qu'il faut que tu appliques une OCR (genre readiris, textbridge ou Omnipage) sur tous tes fichiers pour avoir en sortie des fichiers texte. Ensuite t'as plus qu'à rechercher ton texte dans tous ces fichiers (via l'explorateur de windows ou un programme plus évolué).

Reply

Marsh Posté le 19-06-2007 à 11:39:17    

C'est con, on peut pas faire de macro avec Document Imaging :(

Reply

Marsh Posté le 19-06-2007 à 11:41:18    

rufo > pas besoin d'OCR externe, celui d'Office est suffisant (testé à l'instant)

Reply

Marsh Posté le 19-06-2007 à 11:45:55    

En effet, celui d'Office est satisfaisant.
Il me faudrait donc un programme qui ouvre mes fichiers images un par un et lance la reconnaissance OCR d'Office

Reply

Marsh Posté le 19-06-2007 à 11:49:35    

Ca doit être jouable avec un simple VBS. Mais bon, c'est pas ce qu'il y a de plus propre :)

Reply

Marsh Posté le 19-06-2007 à 12:00:50    

Je me doute. Mais je ne suis pas tres douée en programmation

Reply

Marsh Posté le 19-06-2007 à 12:03:57    

sinon AutoIt. Simple à mettre en oeuvre et fait pour développer des macro : pas besoin de bien maitriser la prog. On peut même faire de petites IHM assez facilement ;) Ca permet aussi de simuler les frappes clavier et les cliques de souris...


Message édité par rufo le 19-06-2007 à 12:05:05
Reply

Marsh Posté le 19-06-2007 à 12:40:00    

Code :
  1. Option Explicit
  2.  
  3. Const picturesPath = "c:\in\tif\"
  4. Const officeImagingPath = """C:\Program Files\Common Files\microsoft shared\MODI\12.0\MSPVIEW.EXE"""
  5.  
  6. Dim objShell
  7. Dim cmdStr
  8. Dim fso
  9. Dim fol
  10. Dim fil
  11.  
  12. Set objShell = CreateObject("WScript.Shell" )
  13. Set fso = CreateObject("Scripting.FileSystemObject" )
  14.  
  15. Set fol = fso.GetFolder(picturesPath)
  16.  
  17. For Each fil In fol.Files
  18.  cmdStr = officeImagingPath & " """ & fil.Path & """"
  19.  objShell.Run cmdStr, 1
  20.  WScript.Sleep 2000
  21.  objShell.SendKeys "%ox"
  22.  WScript.Sleep 5000
  23.  objShell.SendKeys "%ot"
  24.  WScript.Sleep 500
  25.  objShell.SendKeys "{ENTER}"
  26.  WScript.Sleep 3000
  27.  objShell.SendKeys "%{TAB}"
  28.  WScript.Sleep 1000
  29.  objShell.SendKeys "%{F4}"
  30.  WScript.Sleep 500
  31.  objShell.SendKeys "n"
  32.  WScript.Sleep 500
  33. Next


 
Ca "marchouille".

Reply

Marsh Posté le 19-06-2007 à 12:42:35    

Ca fait plus ou moins ce qu'on lui demande (ouvre toutes les images d'un répertoire, les reconnais et exporte le contenu dans Word) mais c'estun peu aléatoire le comportement (logiquement à la fin on n'a plus que les words ouverts mais bon là force est de constater que ça marche pas :D)
 
Pour plus d'infos sur ce qu'on peut envoyer comme touches au programme en cours d'exécution :
http://www.devguru.com/technologies/wsh/17420.asp
 
Notamment il ne serait pas con de faire un %fs suivit d'un File.ShortName & ".doc" puis %{F4} dans Word histoire d'enregistrer le document word sous le même nom que l'image d'origine.
 
En tout cas c'est pas mal comme truc, ça oblige à apprendre les raccourcis clavier :D


Message édité par MagicBuzz le 19-06-2007 à 12:46:12
Reply

Marsh Posté le 19-06-2007 à 12:42:35   

Reply

Marsh Posté le 19-06-2007 à 12:59:14    

l'avantage de AutoIt, c'est qu'il a un mode record de la macro : tu enregistre toutes les actions que tu fais pour un tiff -> ça te génère un script autoit que t'as plus qu'à modifié si besoin est ;)
 
Je l'avais utilisé pour installer des softs automatiquement (style drivers, winzip, photoshop...) à partir d'un fichier de paramétrage.

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed