pense-bête de bruno sanchiz

Accueil > Windows > OCR avec tesseract sous windows

OCR avec tesseract sous windows

Publié le 3 mars 2018, dernière mise-à-jour le 28 avril 2023, 3 visites, visites totales.

Il faut toujours préparer le fichier : une seule colonne, pas d’image , pas de texte qui déborde sur un autre ligne. Chaque ligne doit être le plus horizontal possible.

tesseract

  1. télécharger ici : ici ou UB Mannheim
    ( peut être https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.01.exe )
  1. télécharger le français ici :
    https://github.com/tesseract-ocr/tesseract/wiki/Data-Files ( peut être https://github.com/tesseract-ocr/tessdata/raw/4.00/fra.traineddata ou
    https://github.com/tesseract-ocr/tessdata/raw/3.04.00/fra.traineddata )

copier le fichier fra.traineddata dans le répertoire/dossier
C:\Program Files\Tesseract-OCR\tessdata.

  1. créer un fichier PngVersTexte.bat contenant

    mettre ce fichier dans Users\LeNomDeLUtilisateur\AppData\Roaming\Microsoft\Windows\SendTo

  1. Ensuite, il suffira de cliquer droit sur un fichier et "ENVOYER VERS" , choisir PngVersTexte.bat .
    A côté du fichier image vous trouverez le fichier .txt
[bruno sanchiz]