8 avril 2013

OCR : Extraire le texte d'une image

Source: http://www.pcastuces.com/pratique/bureautique/ocr/page1.htm

Vous avez numérisé un journal ou récupéré l'image d'un article et vous souhaitez pouvoir exploiter le texte que contiennent ces documents. Vous pouvez bien sûr, prendre votre courage à deux mains et recopier tout le texte dans votre traitement de texte habituel. Un travail long et fastidieux.

Pour vous simplifier la tâche, vous pouvez vous tourner vers l'OCR, un procédé informatique de reconnaissance optique des caractères. Le logiciel gratuit FreeOCR peut ainsi récupérer du texte dans l'image d'un texte imprimé, mais également d'une feuille scannée et même d'un document PDF.

Si le résultat nécessite quelques retouches suivant la qualité de votre document original, la plupart des caractères et des mots sont reconnus et vous pouvez récupérer votre texte dans votre traitement de texte, Word ou OpenOffice par exemple. Vous aurez ainsi un document texte que vous pourrez manipuler, retravailler et utiliser à loisir.

Après avoir corrigé les éventuelles erreurs, il ne vous restera plus qu'à remettre en forme le texte, ce qui est tout de même moins contraignant que d'avoir à taper le texte en entier.

Sommaire du dossier :