web-dev-qa-db-fra.com

Comment puis-je implémenter l'OCR sur un site Web en utilisant PHP?

Existe-t-il des bibliothèques OCR gratuites qui fonctionnent avec PHP ou Python sur un serveur Linux? L'idée est de pouvoir télécharger une image et extraire des caractères de ou permettre aux utilisateurs de "dessiner des caractères" et de les analyser à partir de ladite image.

57
Moshe

Puisque vous êtes sur une boîte Linux, je recommande fortement le projet open source de Google ocropus .

Ce n'est pas PHP, mais je pense que ce sera votre meilleure option. Bien sûr, vous pouvez l'appeler de l'intérieur PHP via exec. Son mature et a beaucoup d'options. Du site du projet:

Le moteur OCRopus est basé sur deux projets de recherche: un outil de reconnaissance d'écriture manuscrite hautes performances développé au milieu des années 90 et déployé par le US Census Bureau, et de nouvelles méthodes d'analyse de mise en page hautes performances.

Il existe également un autre projet open source, tesseract . Je l'ai également utilisé dans le passé et j'ai été satisfait des résultats. Comprend la formation, la limitation de votre alphabet, etc.

31
nategood

Avez-vous vu des classes phpOCR d'Andrey Kucherenko? http://www.phpclasses.org/package/2874-PHP-Recognize-text-objects-in-graphical-images.html C'est un vieil article mais peut vous aider.

5
Daniel D