Tesseract (logiciel)
Un article de Wikipédia, l'encyclopédie libre.
| Tesseract | |
| Dernière version | 3.02 (28 octobre 2012) [+/-] |
|---|---|
| Environnements | Linux, OpenBSD, Mac OS X, Windows |
| Type | OCR |
| Licence | Apache |
| Site web | code.google.com/p/tesseract-ocr |
| modifier |
|
Tesseract est un logiciel de reconnaissance optique de caractères sous licence Apache.
Conçu par les ingénieurs de Hewlett Packard de 1985 à 1995, son développement est abandonné pendant les dix années suivantes ; en 2005, les sources du logiciel sont libérées sous licence Apache et le logiciel est actuellement développé par Google. Initialement limité aux caractère ASCII, il supporte parfaitement les caractères UTF-8 et reconnait maintenant 33 langues.
Références [modifier]
- (en) Announcing Tesseract OCR (Luc Vincent, Google Code Blog, August 2006)