Essayez différentes combinaisons de réglages, jusqu'à ce que vous
obteniez les résultats souhaités. Reportez-vous à la page 92 pour
savoir comment optimiser la luminosité.
u
Le texte des images de pages doit être autant que possible propre et
bien formé. Les caractères doivent être séparés les uns des autres et ne
doivent en aucun cas être collés ni superposés. Les caractères
déformés par des marques ou des taches risquent de ne pas être
reconnus.
u
Dans la mesure du possible, évitez d'utiliser le soulignement dans les
documents à reconnaître. Le texte souligné est en effet difficile à
reconnaître, car il modifie la forme des caractères qui descendent sous
la ligne principale (le « q », le « g », le « y », le « p » et le « j »).
u
Vérifiez la résolution de l'image en sélectionnant l'option Afficher
infos sur page dans le menu Fichier. La résolution optimale de l'OCR
est de 300 ppp. Les images dont la résolution est comprise entre 200
et 250 ppp ou supérieure à 400 ppp sont susceptibles de générer une
reconnaissance moins précise. Le programme n'ouvre pas les fichiers
images dont la résolution est inférieure à 200 ppp. Si vos documents
ont cette résolution et que vous disposez des copies papier,
numérisez-les à nouveau avec de meilleurs réglages.
Assurez-vous que les zones sont adaptées
u
Vérifiez l'image de page originale, et assurez-vous que toutes les
parties de texte requises sont délimitées par des zones de texte. Si un
texte n'est pas délimité par une zone, il est généralement ignoré lors
de la reconnaissance.
u
Assurez-vous que les bordures de zones ne coupent pas le texte et que
la définition des zones graphiques est correcte. Redimensionnez les
zones si nécessaire.
u
Assurez-vous que les zones de texte ont été correctement définies.
Modifiez le type, le contenu ou le style des zones si nécessaire et
effectuez une nouvelle reconnaissance du document. Reportez-vous à
la section Spécification de types de zone, page 49.
u
Assurez-vous de ne pas avoir chargé un gabarit de zone inapproprié,
par inadvertance. Si des bordures de zone coupent le texte, la
reconnaissance en souffrira.
Chapitre 6
Dépannage
125