Scanner pour OCR entre 100 et 150€...

Scanner pour OCR entre 100 et 150€... - Scanner - Hardware - Périphériques

Marsh Posté le 26-04-2005 à 22:53:17    

Bonjour,
 
Voilà, j'ai pour l'instant un Agfa SnapScan 1212u (un peu ancien, lent et en USB1, résolution 600dpi x 1200dpi). Je fais essentiellement des scans de documents pour archivage et envoi par mail.
J'essaye de faire des OCR avec Adobe Acrobat et ce scanner, j'ai fait des essais à différentes résolutions et c'est toujours dégueulasse (même en augmentant, j'ai parfois des effets bizarres), c'est-à-dire que je me retrouve souvent avec la moitiée d'une phrase qui reste en bitmap, l'aute moitiée en texte mais avec différentes fontes, etc...
Est-ce que c'est le logiciel Acrobat qui est trop juste ?
 
Est-ce que j'ai intérêt à passer à un autre scanner (dans ce cas là, j'ajouterai dans mes utilisations le scan de diapositives) ? Faut-il regarder dans la direction des petits Canon Lid, des plus gros Canon (CS 4200 ou 5200F), des Epson (2480) ?
Est-ce que je dois passer à un autre logiciel d'OCR (comme Omnipage même LE) sachant que mes fichiers de destination seront de toutes façons des PDF ?
 
Merci par avance pour vos réponses.


---------------
The Magic Words are Squeamish Ossifrage.
Reply

Marsh Posté le 26-04-2005 à 22:53:17   

Reply

Marsh Posté le 27-04-2005 à 11:09:50    

Moi aussi, ça m'intéresse. J'ai Adobe Acrobat 5 et un vieux scanner BenQ type 640 (résolution optique max de 600x600). pour de l'OCR, il faut au moins scanner à du 300p. Pour un document PDF, il faut scanner avec qualité au moins moyenne, car Adobe utilise des techniques de lissage de police qui dégradent (à mon avis) la limite des caractères et qui les rendent moins lisibles sur documents imprimés. Malgré quelques réglages et essais et erreurs, j'ai le même résultat, insastisfaisant pour moi. Donc, je pense reprendre un scanner moderne rapide en 300p., type Canon Lide 35 ou le 4200F, suivant des test de scanners glanés ça et là. La résolution maximale est sans importance pour mon usage.
Bref, quelqu'un connait un scanner à moins de 150 euro et qui scanne un A4 en 5 sec. en 300p. en 24 bits ??

Reply

Marsh Posté le 28-04-2005 à 22:31:15    

Je viens d'acquérir l'Epson 2480 pour 99€. La qualité des scans et la vitesse ont l'air très très bonnes, mais par contre, j'ai failli sauter au plafond quand il a démarré.
Je ne m'attendais pas à un truc aussi bruyant et strident.
 
J'hésitais auparavant avec le Canon 4200 (40€ de plus), est-ce que j'ai fait un bon choix ?


---------------
The Magic Words are Squeamish Ossifrage.
Reply

Marsh Posté le 30-04-2005 à 23:19:19    

Quel topic à succès :W :W :W


---------------
The Magic Words are Squeamish Ossifrage.
Reply

Marsh Posté le 02-05-2005 à 14:04:07    

j'ai acheté le 4200f sur un coup de poker au moment ou il est sortit. et bin je suis vraiment pas décus. il marche nickel avec omnipage pour l'ocr :)
 
rapide en usb 2.0.
 
son seul probleme reside au niveau du scan de negatif.
 
Mise a prt cela le rendu est tres bon et est tres précis.


Message édité par stadiste le 02-05-2005 à 14:05:56
Reply

Marsh Posté le 02-05-2005 à 14:13:07    

En voyant les essais sur http://www.hardware.fr/articles/552/page1.html on voit que ce Canon est vraiment excellent. Les vitesses de scan ont l'air de se tenir avec l'Epson.
 
Est-ce que sur le tien le scan de négatif est aussi mauvais (en colorimétrie) ? Combien de diapositives peut-on scanner en même temps ?
 
Et est-ce qu'il fait du bruit ?


---------------
The Magic Words are Squeamish Ossifrage.
Reply

Marsh Posté le 02-05-2005 à 19:28:44    

J'ai essayé 4 logiciels : Adobe Acrobat 7, Adobe Paper Capture 3, Scansoft Omnipage 14 pro, Abby Finereader 7.
J'ai fait les essais avec mes docs et chacun des exemples de ces logiciels, en les croisant.
 
Paper Capture est technologiquement complètement dépassé. Acrobat 7 a le défaut que l'on connait (lissage étrange des caractères, etc...).
Omnipage demande des dizaines de confirmations par page, beaucoup de phrases gardent des mots en mode graphique (comme Acrobat), il y a des paragraphes qui deviennent non homogènes (en fontes, taille de fontes, alignement). Ces résultats sont valables sur leurs propres exemples.
 
FineReader : je ne connais que depuis peu et j'ai été très agréablement surpris. Il n'est pas cher (100€ en version pro) et fonctionne super bien. Les paragraphes sont homogènes, l'OCR est rapide, il n'y a pas de confirmations abusives, et le comble : les exemples d'Omnipages sont mieux reconnus avec FineReader !!!! Et les exportations (en PDF 1.2) sont deux foirs plus petites que celle d'Omnipage (en pdf 1.4) alors que les résolutions sont les mêmes.
 
Voilà ! A bon entendeur !


Message édité par _MoebiuS_ le 02-05-2005 à 19:29:25

---------------
The Magic Words are Squeamish Ossifrage.
Reply

Marsh Posté le 03-05-2005 à 21:18:22    

beh en fait, tu peux scanner 4 negatifs, quand au rendu de couleur, tu peux toujours le corriger apres ;)
 
le soft qui est fournis avec le canon est photostudio 5.5


---------------
"Il ne faut jamais sous estimer le caractère prévisible de la bêtise humaine"
Reply

Marsh Posté le 04-05-2005 à 10:19:37    

Bon, ben, j'ai acheté le 4200F et j'ai scanné un vieux livre (de 1980, sur le jardinage, avec beaucoup d'images, pas de photos) pour voir avec le logiciel fourni (ScanSoft Omnipage pour l'OCR) et presque les mêmes que ceux dont parle Moebius (Omnipage 14, FineReader 7). J'arrive aux mêmes conclusions que lui, sauf que FineReader m'a laissé un sentiment mitigé, point-de-vue qualité reconnaissance avec mise en forme. Alors, j'ai essayé ReadIRIS 10. C'est celui-là que je garde mais pas en automatique (reconnaissance manuelle des cadres). Sinon, le 4200 est assez rapide (10 à 12 sec pour une page A4 300p.).

Reply

Marsh Posté le 04-05-2005 à 11:10:46    

stadiste a écrit :

beh en fait, tu peux scanner 4 negatifs, quand au rendu de couleur, tu peux toujours le corriger apres ;)


 
Et pour les diapositives avec cache, tu peux en faire 4 à la fois aussi ? L'Epson les fait par groupe de 2. C'est vrai que la colorimétrie, on peut toujours la corriger à postériori ;)
 

Edgard_123 a écrit :

Bon, ben, j'ai acheté le 4200F et j'ai scanné un vieux livre (de 1980, sur le jardinage, avec beaucoup d'images, pas de photos) pour voir avec le logiciel fourni (ScanSoft Omnipage pour l'OCR) et presque les mêmes que ceux dont parle Moebius (Omnipage 14, FineReader 7). J'arrive aux mêmes conclusions que lui, sauf que FineReader m'a laissé un sentiment mitigé, point-de-vue qualité reconnaissance avec mise en forme. Alors, j'ai essayé ReadIRIS 10. C'est celui-là que je garde mais pas en automatique (reconnaissance manuelle des cadres). Sinon, le 4200 est assez rapide (10 à 12 sec pour une page A4 300p.).


 
Je vais essayer ton soft ReadIris pour voir. Dans mes comparatifs, FineReader s'en était bien sorti (pour un soft à 120€ par rapport à un Omnipage à 700€...) même avec les mises en page tordue. En particulier, j'ai essayé les exemples livré avec Omnipage sur FineReader et c'est ce dernier qui s'en sortait le mieux (l'exemple le plus flagrant est opsample5_ENG_FRE_GER.tif qui comporte des images en insert, plusieurs colonnes, des titres en rouges et paragraphes en noirs, 3 langues dans le même document allemand-français-anglais, etc...).
 
10-12 secondes en A4 300dpi, c'est en noir & blanc, grayscale ou couleur ?


---------------
The Magic Words are Squeamish Ossifrage.
Reply

Marsh Posté le 04-05-2005 à 11:10:46   

Reply

Marsh Posté le 05-05-2005 à 18:21:50    

Bon, j'ai terminé mon scan de bouquin rapidement, bien plus vite qu'avec mon ancien scanner (ACER 640). Pour préciser les choses, les 10-12 secondes, c'est en gris. Comptons le double pour un document couleur [edit : toujours en 300ppi]. Mais au total, depuis la prévisualisation (très très rapide !) jusqu'à la fin de la page placée dans ReadIRIS avec l'orientation et le redressement automatiques activés des pages, il faut compter 50 sec. par page (2xA5 du bouquin pour faire du A4).
Mais l'analyse auto de la page ne me satisfait pas car trop de chipotages ensuite sur le document WORD 97 que j'ai. Je peux envoyer un exemple de mon livre si tu veux et la conversion en fichier DOC. Très bon taux de réussites au total, même avec de petits caractères (+/- 7 points) par rapport à ce que je connais (j'avais déjà beaucoup travaillé avec la version 4 de ABBYY et la version 11 de SCANSOFT).
Bon, ça reste de l'OCR, donc faut se démener grave avec les outils d'édition pour remettre les morceaux ensemble (je scanne par paquets de 6 à 8 pages selon les difficultés d'édition) et corriger ce qui doit l'être.


Message édité par Edgard_123 le 05-05-2005 à 18:27:02
Reply

Marsh Posté le 29-05-2005 à 12:38:47    

Pour ceux que cela intéressent encore, voici un lien vers des tests de logiciels OCR.
 
http://www.01net.com/article/277943.html?d=origine
 
A+
 

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed