web-dev-qa-db-fra.com

Quel moteur OCR est le meilleur: Tesseract ou OCRopus?

J'ai essayé Tesseract avec iPhone et évalué sa précision à 70% sans prétraitement d'image. J'ai également remarqué qu'il pouvait être difficile d'extraire des chiffres. J'ai entendu parler du moteur OCRopus OCR: quel est le meilleur, Tesseract ou OCRopus, en termes d'extraction de chiffres et si mon prétraitement d'image est faible?
Quelqu'un a-t-il effectué des tests en utilisant les deux moteurs en comparant les résultats en utilisant les métriques habituelles?

32
Ahmed Hussein

À l'origine, OCRopus utilisait Tesseract comme moteur de reconnaissance à l'intérieur, mais plus tard, il l'a changé pour son propre moteur flambant neuf. Il est encore frais et non mûr. Nous avons comparé la précision il y a un an environ, et OCRopus perdait définitivement face à Tesseract, je ne parle même pas d'enignes commerciales. Depuis lors, j'ai cessé de suivre les progrès d'OCRopus, mais ce que je sais vraiment, c'est que l'activité sur le forum d'assistance d'OCRopus est proche de zéro maintenant. Cela signifie que personne ne l'utilise. La plupart du temps, les gens utilisent des moteurs commerciaux, mais si le prix est un problème pour eux et qu'ils peuvent tolérer une précision inférieure, ils utilisent Tesseract. C'est certainement le meilleur parmi l'Open Source.

31
Tomato

Vous pouvez également vérifier l'activité des projets dans le lien "changements"

https://code.google.com/p/ocropus/source/list?repo=ocropy

https://code.google.com/p/tesseract-ocr/source/list

tesseract est beaucoup plus occupé

1
IvanM