web-dev-qa-db-fra.com

Erreur Tesseract Not Found

J'essaie d'utiliser pytesseract en python, mais je finis toujours par l'erreur:

"TesseractNotFoundError: tesseract n'est pas installé ou il ne se trouve pas dans votre chemin"

pytesseract et tesseract sont installés dans le système. Je suis nouveau sur Python donc j'apprécierai vraiment si quelqu'un peut m'aider avec cette

28
PreetyP

J'ai essayé d'ajouter à la variable de chemin comme d'autres l'ont mentionné, mais j'ai toujours reçu la même erreur. ce qui a bien fonctionné a été d’ajouter ceci à mon script:

pytesseract.pytesseract.tesseract_cmd = r "C:\Fichiers de programme .__ (x86)\Tesseract-OCR\tesseract.exe"

18
Ben Hooper

J'ai eu cette erreur parce que j'ai installé pytesseract avec pip mais j'ai oublié de l'installer avec apt. dans cette situation, installez-le avec ces commandes:

Sudo apt update
Sudo apt install tesseract-ocr
Sudo apt install libtesseract-dev
13
Ali

tesseract-ocr est probablement absent de votre ordinateur. Vérifiez les instructions d'installation ici: https://github.com/tesseract-ocr/tesseract/wiki

Sur un Mac, vous pouvez simplement installer en utilisant homebrew:

brew install tesseract

Il devrait bien fonctionner après cela

8
KornholioBeavis

Je suis sous Mac OS et ai installé tesseract avec brew, alors voici mon point de vue. Puisque pytesseract est juste la façon dont vous pouvez accéder à tesseract à partir de python, vous devez spécifier où tesseract se trouve déjà sur votre ordinateur. 

Pour Mac OS

Essayez de trouver où se trouve tesseract.exe si vous l'avez installé à l'aide de brew, sur votre utilisation du terminal: 

>brew list tesseract

Cela devrait indiquer où se trouve votre tesseract.exe, quelque part plus ou moins semblable à 

> /usr/local/Cellar/tesseract/3.05.02/bin/tesseract

Ensuite, en suivant leurs instructions :

pytesseract.pytesseract.tesseract_cmd = r'<full_path_to_your_tesseract_executable>'

pytesseract.pytesseract.tesseract_cmd = r '/ usr/local/Cellar/tesseract/3.05.02/bin/tesseract'

devrait faire l'affaire!

5
Louis Lin

Une chose simple qui a réellement fonctionné pour moi dans Jupyter Notebook, était d'utiliser double barre oblique inversée au lieu d'une seule barre oblique inversée dans le chemin d'accès pytesseract.pytesseract.tesseract_cmd:

pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'
3
evanca

J'ai rencontré le même problème. J'espère que vous avez installé depuis https://github.com/UB-Mannheim/tesseract/wiki et que vous avez également effectué l'installation pip pytesseract.

Si tout va bien, vous devriez voir le chemin C:\Program Files (x86)\Tesseract-OCR où tesseract.exe est disponible.

L’ajout d’une variable de chemin ne m’a pas aidé; j’ai ajouté une nouvelle variable portant le nom tesseract dans les variables d’environnement portant la valeur C:\Program Files (x86)\Tesseract-OCR\tesseract.exe

Maintenant, ouvrez la fenêtre de commande et tapez simplement tesseract, cela devrait fonctionner et vous donner des informations d'utilisation.

Importez simplement pytesseract et cette ligne devrait vous permettre de lire une chaîne de texte.

text = pytesseract.image_to_string (im, config = config)

prendre plaisir!

2
aniket

Vous pouvez télécharger la configuration de tesseract-ocr en utilisant le lien suivant,

Tesseract pour Windows

Ensuite, ajoutez une nouvelle variable avec le nom tesseract dans les variables d'environnement avec la valeur C:\Program Files (x86)\Tesseract-OCR\tesseract.exe.

2
Codemaker

Installez tesseract à partir de https://github.com/UB-Mannheim/tesseract/wiki et ajoutez le chemin de tesseract.exe à la variable d'environnement Path.

1
Ranjan Kumar

Je suis confronté au même problème. Je viens d'utiliser cette commande qui va m'aider.

Sudo apt install tesseract-ocr
1
Vivekanand Panda

Sous l'environnement Windows 10, la méthode suivante fonctionne pour moi:

  1. https://github.com/tesseract-ocr/tesseract/wiki Téléchargez tesseract et installez-le. La version Windows est disponible ici: https://github.com/UB-Mannheim/tesseract/wiki

  2. Recherchez le fichier de script pytesseract.py dans C:\Users\User\Anaconda3\Lib\site-packages\pytesseract et ouvrez-le . Modifiez le code suivant de tesseract_cmd = 'tesseract' en: tesseract_cmd = 'D:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

  3. Vous pouvez également avoir besoin d'ajouter la variable d'environnement D:/Program Files (x86)/Tesseract-OCR/

Voila!

0
ahbon

Petite erreur - je savais que je devais ouvrir/fermer ma cmd pour que le chemin mis à jour réponde. En utilisant Jupyter Notebook, je devais arrêter le client et le réinitialiser également.

0
Schalton

Importez-vous 

from tesseract import image_to_string

Ne pas importer de pytesseract

0
HeTheMan

J'utilise actuellement Windows et je devais développer un analyseur syntaxique PDF, mais l'ajout d'une nouvelle variable d'environnement via sysdm.cpl seul ne fonctionnait pas. Pour les autres utilisateurs Windows, je suggère fortement d’ajouter également C:\Program Files (x86)\Tesseract-OCR à votre profile.ps1 (si vous utilisez Powershell).

0
noBee

Je faisais également face au même problème, ajoutez simplement C:\Program Files (x86)\Tesseract-OCR à votre variable de chemin. Si cela ne fonctionne toujours pas, ajoutez C:\Program Files (x86)\Tesseract-OCR\tessdata à votre variable de chemin dans une nouvelle ligne. Et n'oubliez pas de redémarrer votre ordinateur après avoir ajouté la variable de chemin. 

0
emon