Accueil > Windows > OCR avec tesseract sous windows
OCR avec tesseract sous windows
Publié le 3 mars 2018, dernière mise-à-jour le 28 avril 2023, 3 visites, visites totales.
Il faut toujours préparer le fichier : une seule colonne, pas d’image , pas de texte qui déborde sur un autre ligne. Chaque ligne doit être le plus horizontal possible.
tesseract
- télécharger ici : ici ou UB Mannheim
( peut être https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.01.exe )
- télécharger le français ici :
https://github.com/tesseract-ocr/tesseract/wiki/Data-Files ( peut être https://github.com/tesseract-ocr/tessdata/raw/4.00/fra.traineddata ou
https://github.com/tesseract-ocr/tessdata/raw/3.04.00/fra.traineddata )
copier le fichier fra.traineddata dans le répertoire/dossier
C:\Program Files\Tesseract-OCR\tessdata.
- créer un fichier PngVersTexte.bat contenant
mettre ce fichier dans Users\LeNomDeLUtilisateur\AppData\Roaming\Microsoft\Windows\SendTo
- Ensuite, il suffira de cliquer droit sur un fichier et "ENVOYER VERS" , choisir PngVersTexte.bat .
A côté du fichier image vous trouverez le fichier .txt