OCR : Extraire le texte d'une image



Documents pareils
Emporter Windows XP sur une clé USB

Partager rapidement un fichier volumineux

Cloner son système avec True Image

Mettre Linux sur une clé USB bootable et virtualisable

Créer un panorama animé à 360

Supprimer définitivement un fichier

Sauvegarder automatiquement ses documents

Contrôler plusieurs ordinateurs avec un clavier et une souris

Partager son lecteur optique

Gérer, stocker et partager vos photos grâce à Picasa. Janvier 2015

SimpleOCR, un logiciel gratuit de reconnaissance de caractères

Cré ér un panorama animé a 360

Rechercher et supprimer les doublons!

Utilisation de l'outil «Open Office TEXTE»

Réparer un disque dur passé en RAW

Vérifier l'état de santé de son disque dur

Sauvegarder automatiquement sa clé USB

PRISE EN MAIN D UN TABLEUR. Version OPEN OFFICE

Guide d'installation sous Windows

Licence de Biologie, 1ère année. Aide. [Aide 1] Comment utiliser l'explorateur Windows? Comment créer des dossiers?

Utilisation du logiciel Epson Easy Interactive Tools

Protéger ses données dans le cloud

Effacer le contenu d'un disque dur de manière sécurisée

FICHIERS ET DOSSIERS

Comment formater votre ebook avec Open Office

Contro ler plusieurs ordinateurs avec un clavier et une souris

Décompresser, créer une archive au format «ZIP»

Réparer un disque dur passé en RAW

SAUVEGARDER SES DONNEES PERSONNELLES

Retrouver un mot de passe perdu de Windows

Cours Excel : les bases (bases, texte)

LECTURE DES FICHIERS DE FACTURES

Fiche n 25 01/03/2002. Power Archiver

Installation d'une galerie photos Piwigo sous Microsoft Windows.

Les dossiers compressés (ou zippés)

Qlik Sense Desktop. Qlik Sense Copyright QlikTech International AB. Tous droits réservés.

ENVOI EN NOMBRE DE SMS

LECON 2 : PROPRIETES DE L'AFFICHAGE Version aout 2011

L'explorateur de fichier de Windows 8.1

ESPACE MULTIMEDIA DU CANTON DE ROCHESERVIERE

Utiliser des logiciels Windows sous Linux Ubuntu

Découvrir OpenOffice Comment optimiser et formater votre ebook avec OpenOffice

Gérer ses fichiers et ses dossiers avec l'explorateur Windows. Février 2013

Installation d un ordinateur avec reprise des données

Avertissement : Nos logiciels évoluent rendant parfois les nouvelles versions incompatibles avec les anciennes.

Tutorial Cobian Backup

Installation et paramétrage. Accès aux modèles, autotextes et clip- art partagés

Exposer ses photos sur Internet

Créer une trace, obtenir son fichier gpx et sa carte Ou Afficher un fichier trace GPX

1) Installation de Dev-C++ Téléchargez le fichier devcpp4990setup.exe dans un répertoire de votre PC, puis double-cliquez dessus :

Table des matières. F. Saint-Germain / S. Carasco Document réalisé avec OpenOffice.org Page 1/13

À propos de Kobo Desktop Télécharger et installer Kobo Desktop... 6

ENVOI EN NOMBRE DE SMS

Comment récupérer toutes vos données perdues ou effacées gratuitement!

Table des matières. 1 À propos de ce manuel Icônes utilisées dans ce manuel Public visé Commentaires...

Utiliser le logiciel Photofiltre Sommaire

Base élèves : des étiquettes avec OpenOffice 2.0

Manipuler fichiers et dossiers

Guide d installation du logiciel Proteus V.8 Sous Windows Vista, 7, 8

Le service de création de site Internet : Mode d emploi. La Création de Site Internet

La technologie au collège

Prise en main du logiciel. Smart BOARD Notebook 10

Utilisez Toucan portable pour vos sauvegardes

Formation Informatique. Utiliser les périphériques informatiques

COPIER, COUPER, COLLER, SELECTIONNER, ENREGISTRER.

Bien travailler sur plusieurs écrans

Utilisation de l outil lié à MBKSTR 9

Installer Windows 8 depuis une clé USB

DOCUMENTATION VISUALISATION UNIT

COMMENT INSTALLER LE SERVEUR QIPAIE

FICHE 1 : LANCER PUBLISHER

Support de formation pour l'installation d'un logiciel gratuit de retouche d'images et gestion de la qualité, taille et format des images :

Prise en main du logiciel Smart BOARD

Les méthodes utilisées pour compresser, puis décompresser un fichier pour en faire une archive, pour les débutants.

Consignes générales :

Je sais utiliser. Logiciel gratuit de gestion des photos. Étude en 5 parties

Guide informatique AUDIT EVALUATION DE LA PRATIQUE DE L ANTIBIOPROPHYLAXIE EN MATERNITE

NE PAS INSERER DE CD FAIT POUR WINDOWS LORS DE L'INSTALLATION D'INTERNET NE PAS INSERER LE CD D'INSTALLATION DE VOTRE FOURNISSEUR D'ACCES

Pour le désactiver, décochez "Site web du logiciel au démarrage" dans le menu "Fichier"

iil est désormais courant de trouver sur Internet un document

Tutoriel Drupal version 7 :

Catalogue Formations informatiques

Dans la série LES TUTORIELS LIBRES présentés par le site FRAMASOFT. Compression - Décompression avec 7-Zip. Georges Silva

Utilisation de l éditeur.

GESTION DE L'ORDINATEUR

GUIDE Excel (version débutante) Version 2013

Mise en route de Cobian Backup

Automatisation d'une Facture 4. Liste Déroulante Remises Case à cocher Calculs

GUIDE D UTILISATION DU BACKOFFICE

Tester la se curite de son re seau WiFi

Ladibug TM 2.0 Logiciel de présentation visuel d'image Manuel de l utilisateur - Français

La Clé informatique. Formation Excel XP Aide-mémoire

Se débarrasser des s indésirables

Espace pro. Installation des composants avec Firefox. Pour. Windows XP Vista en 32 et 64 bits Windows 7 en 32 et 64 bits

Sauvegarder ses données avec Syncback Windows 98, 2000, Me, NT, XP

Atelier Découverte de Windows. janvier 2012

Pop-Art façon Roy Liechtenstein

Transcription:

OCR : Extraire le texte d'une image Vous avez numérisé un journal ou récupéré l'image d'un article et vous souhaitez pouvoir exploiter le texte que contiennent ces documents. Vous pouvez bien sûr, prendre votre courage à deux mains et recopier tout le texte dans votre traitement de texte habituel. Un travail long et fastidieux. Pour vous simplifier la tâche, vous pouvez vous tourner vers l'ocr, un procédé informatique de reconnaissance optique des caractères. Le logiciel gratuit FreeOCR peut ainsi récupérer du texte dans l'image d'un texte imprimé, mais également d'une feuille scannée et même d'un document PDF. Si le résultat nécessite quelques retouches suivant la qualité de votre document original, la plupart des caractères et des mots sont reconnus et vous pouvez récupérer votre texte dans votre traitement de texte, Word ou OpenOffice par exemple. Vous aurez ainsi un document texte que vous pourrez manipuler, retravailler et utiliser à loisir. Après avoir corrigé les éventuelles erreurs, il ne vous restera plus qu'à remettre en forme le texte, ce qui est tout de même moins contraignant que d'avoir à taper le texte en entier. Télécharger et installer FreeOCR

Vous pouvez télécharger FreeOCR gratuitement depuis la logithèque PC Astuces. Rendez-vous sur la fiche de FreeOCR dans la logithèque PC Astuces. Cliquez sur le lien Télécharger gratuitement. http://www.pcastuces.com/logitheque/freeocr.htm Cliquez sur le bouton Enregistrer. Choisissez un dossier où sauvegarder le fichier et cliquez une nouvelle fois sur le bouton Enregistrer. Une fois le téléchargement terminé, cliquez sur le bouton Ouvrir.

Cliquez sur le lien Extraire tous les fichiers. L'assistant Extraction de dossiers compressés s'ouvre alors. Cliquez sur le bouton Suivant.

Sélectionnez le dossier où décompresser l'archive et cliquez sur Suivant. Cliquez enfin sur le bouton Terminer.

Double cliquez sur le fichier freeocr25.exe décompressé. Cliquez sur le bouton Exécuter.

L'assistant d'installation de FreeOCR s'ouvre alors. Cliquez sur le bouton Next. Sélectionnez l'option I accept the terms of the license agreement.

Cliquez sur le bouton Install. Cliquez enfin sur le bouton Finish.

Ajouter le dictionnaire français Reconnaissant par défaut les textes en anglais, vous pouvez facilement ajouter le dictionnaire pour reconnaître les textes en français. Dans votre navigateur Web, rendez-vous à cette adresse : http://code.google.com/p/tesseract-ocr/downloads/list. Téléchargez French language data for Tesseract.

Lancez le téléchargement du fichier. Enregistrez le fichier sur votre disque dur.

Ouvrez le fichier avec WinRAR ou un logiciel équivalent supportant les archives au format TAR.GZ. Ouvrez le dossier tessdata. Sélectionnez tous les fichiers de l'archive.

Dans l'explorateur Windows, ouvrez le dossier C:\WINDOWS\tessdata. Faites alors glisser les fichiers de WinRAR dans le dossier que vous venez d'ouvrir. Le logiciel reconnait alors le texte des documents en français.

Extraire le texte d'une image Que cela soit à partir d'un document scanné ou d'une brochure, FreeOCR peut reconnaitre le texte présent dans une image. Lancez FreeOCR en double cliquant sur son icône sur le Bureau. Cliquez sur le bouton Open.

Sélectionnez sur votre disque dur l'image dont vous souhaitez extraire le texte. Cliquez sur le bouton Ouvrir. Cliquez sur la croix rouge pour effacer le texte précédemment reconnu.

Déroulez la liste OCR language et sélectionnez l'option fra afin de reconnaître le texte en français. Cliquez sur le bouton OCR. Le logiciel analyse alors votre image.

Le résultat est affiché dans le cadre droit de la fenêtre. Vous pouvez alors copier le texte reconnu dans le logiciel (Word par exemple) de votre choix ou l'enregistrer dans un fichier texte en utilisant les contrôles au centre de la fenêtre. Vous pouvez ensuite corriger les éventuelles erreurs dans votre traitement de texte.

Extraire un paragraphe Pour n'extraire le texte que d'une partie de l'image, sélectionnez-la dans le cadre gauche de la fenêtre, à partir de l'aperçu de l'image originale. Vous pourrez ainsi délimiter précisément le texte à extraire et exclure les éléments perturbateurs (bordures, images, ). Extraire le texte d'un PDF Vous avez récupéré un document PDF. FreeOCR peut vous aider à extraire le texte de ce document pour pouvoir le retravailler dans votre traitement de texte habituel. Lancez FreeOCR en double cliquant sur son icône sur le Bureau.

Cliquez sur le bouton Open PDF. Sélectionnez sur votre disque dur le document PDF dont vous souhaitez extraire le texte. Cliquez sur le bouton Ouvrir. Cliquez sur la croix rouge pour effacer le texte précédemment reconnu.

Vérifiez que la langue française est bien sélectionnée. Sélectionnez le passage à examiner. Vous pouvez utiliser les flèches pour passer d'une page à une autre du document PDF. Cliquez sur le bouton OCR.

Le résultat est affiché dans le cadre droit de la fenêtre. Vous pouvez alors copier le texte reconnu dans le logiciel (Word par exemple) de votre choix ou l'enregistrer dans un fichier texte en utilisant les contrôles au centre de la fenêtre. Vous pouvez ensuite corriger les éventuelles erreurs dans votre traitement de texte.

Extraire le texte d'un document à scanner Pour reconnaitre le texte d'un document papier, vous pouvez le scanner sous la forme d'une image puis l'importer ensuite dans FreeOCR. Vous pouvez également laisser FreeOCR le numériser pour vous. Lancez FreeOCR en double cliquant sur son icône sur le Bureau. Cliquez sur le bouton Scan.

Sélectionnez votre scanner dans la liste et cliquez sur le bouton Sélectionner. Numérisez, comme vous le faite habituellement votre document.

Une fois scanné, le document est importé dans FreeOCR. Cliquez sur la croix rouge pour effacer le texte précédemment reconnu. Vérifiez que la langue française est bien sélectionnée.

Sélectionnez le passage à examiner puis cliquez sur le bouton OCR pour lancer la reconnaissance. Le résultat est affiché dans le cadre droit de la fenêtre. Vous pouvez alors copier le texte reconnu dans le logiciel (Word par exemple) de votre choix ou l'enregistrer dans un fichier texte en utilisant les contrôles au centre de la fenêtre.

Vous pouvez ensuite corriger les éventuelles erreurs dans votre traitement de texte. Améliorer la pertinence de la reconnaissance Vous avez sans doute remarqué que des erreurs viennent souvent se glisser dans les reconnaissances de FreeOCR.

Suivez ces conseils pour limiter les erreurs et améliorer la reconnaissance des caractères. Numérisez vos documents en noir et blanc, dans une précision entre 200 et 300 dpi. Faites pivoter vos images afin que le texte soit horizontal. Sélectionnez la partie à extraire en excluant tout ce qui n'a aucun rapport avec du texte : les bordures, les images,... N'hésitez pas à travailler sur plusieurs petites parties : d'abord le titre, un paragraphe, un second, etc. Si un texte se trouve sur plusieurs colonnes, travailler sur chaque colonne, en les sélectionnant les unes après les autres. La commande Adjust image constrast du menu OCR vous permet d'augmenter le contraste afin de faire ressortir le texte. N'hésitez pas à l'utiliser sur les images au texte clair. Récupérer une image Notez que vous pouvez récupérer une image dans un article en la sélectionnant dans le cadre gauche de la fenêtre et en cliquant dessus avec le bouton droit de la souris. Sélectionnez alors la commande Copy selection to clipboard puis collez l'image dans votre traitement de texte. PC Astuces http://www.pcastuces.com/pratique/bureautique/ocr/