22
Introduction
Qu'est-ce que la reconnaissance optique de
caractères ?
La reconnaissance optique des caractères (OCR) correspond au processus
d'extraction du texte d'une image. Les images peuvent provenir de la
numérisation de documents papier ou de fichiers images. Le texte des
images n'est pas directement éditable. L'image est constituée d'une
multitude de points (pixels) qui forment ensemble des formes de
caractères. Ces formes représentent l'image du texte sur une page.
Au cours de l'OCR, OmniPage Pro analyse les formes des caractères
contenus dans l'image et propose des solutions afin de produire un texte
qui pourra être éditable. En d'autres termes, le programme d'OCR « lit »
la page.
Une fois l'OCR terminé, vous pouvez exporter le texte reconnu vers une
large gamme d'applications de traitement de texte, de publication assistée
par ordinateur (PAO) ou de feuilles de calcul.
Fonctions avancées de l'OCR
Lors de l'OCR, OmniPage Pro X permet non seulement de récupérer le
texte, mais également de conserver la plupart des caractéristiques du
document, en particulier :
t
Graphiques
Photos, logos et illustrations, par exemple. Le programme ne reconnaît
pas l'écriture manuscrite. Cependant, les signatures peuvent être
enregistrées en tant que graphique.
t
Formatage du texte
Formatage des caractères, tel que le type, la taille (corps) et le style des
polices (style gras ou italique, par exemple). Formatage des paragraphes,
tel que les retraits, les tabulations, les marges et l'interlignage.
t
Formatage des pages
Agencement des colonnes, disposition des paragraphes et emplacement
des éléments graphiques.