Vous avez numérisé un journal ou récupéré l'image d'un article et vous
souhaitez pouvoir exploiter le texte que contiennent ces documents. Vous
pouvez bien sûr, prendre votre courage à deux mains et recopier tout le
texte dans votre traitement de texte habituel. Un travail long et fastidieux.
Pour vous simplifier la tâche, vous pouvez vous tourner vers l'OCR, un procédé informatique de reconnaissance optique des caractères. Le logiciel gratuit FreeOCR peut ainsi récupérer du texte dans l'image d'un texte imprimé, mais également d'une feuille scannée et même d'un document PDF.
Si le résultat nécessite quelques retouches suivant la qualité de votre document original, la plupart des caractères et des mots sont reconnus et vous pouvez récupérer votre texte dans votre traitement de texte, Word ou OpenOffice par exemple. Vous aurez ainsi un document texte que vous pourrez manipuler, retravailler et utiliser à loisir.
Après avoir corrigé les éventuelles erreurs, il ne vous restera plus qu'à remettre en forme le texte, ce qui est tout de même moins contraignant que d'avoir à taper le texte en entier.
Sommaire du dossier :
Introduction
Télécharger et installer FreeOCR
Ajouter le dictionnaire français
Extraire le texte d'une image
Extraire le texte d'un PDF
Extraire le texte d'un document à scanner
Améliorer la pertinence de la reconnaissance
Pour vous simplifier la tâche, vous pouvez vous tourner vers l'OCR, un procédé informatique de reconnaissance optique des caractères. Le logiciel gratuit FreeOCR peut ainsi récupérer du texte dans l'image d'un texte imprimé, mais également d'une feuille scannée et même d'un document PDF.
Si le résultat nécessite quelques retouches suivant la qualité de votre document original, la plupart des caractères et des mots sont reconnus et vous pouvez récupérer votre texte dans votre traitement de texte, Word ou OpenOffice par exemple. Vous aurez ainsi un document texte que vous pourrez manipuler, retravailler et utiliser à loisir.
Après avoir corrigé les éventuelles erreurs, il ne vous restera plus qu'à remettre en forme le texte, ce qui est tout de même moins contraignant que d'avoir à taper le texte en entier.
Sommaire du dossier :