Tesseract (logiciel)

Informations
Développé par	Ray Smith (d)
Dernière version	5.3.4 (18 janvier 2024)
Dépôt	github.com/tesseract-ocr/tesseract
Assurance qualité	Intégration continue
Écrit en	C++
Système d'exploitation	GNU/Linux, Microsoft Windows, macOS, BSD, GNU/Hurd (d), Android et iOS
Environnement	Linux, OpenBSD, Mac OS X, Windows
Formats lus	TIFF, Portable Network Graphics, JPEG File Interchange Format, JP2 (d) et WebP
Formats écrits	HOCR (en), fichier texte, Portable Document Format, ALTO (XML) et TSV
Type	OCR
Licence	Apache
Documentation	github.com/tesseract-ocr/tessdoc et tesseract-ocr.github.io
Site web	https://github.com/tesseract-ocr/tesseract

Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus.

Cet article ne cite pas suffisamment ses sources (septembre 2023).

Si vous disposez d'ouvrages ou d'articles de référence ou si vous connaissez des sites web de qualité traitant du thème abordé ici, merci de compléter l'article en donnant les références utiles à sa vérifiabilité et en les liant à la section « Notes et références ».

En pratique : Quelles sources sont attendues ? Comment ajouter mes sources ?

Tesseract est un logiciel de reconnaissance optique de caractères sous licence Apache.

Conçu par les ingénieurs de Hewlett Packard de 1985 à 1995, son développement est abandonné pendant les dix années suivantes ; en 2005, les sources du logiciel sont publiées sous licence Apache et Google poursuit son développement. Initialement limité aux caractères ASCII, il reconnaît les caractères UTF-8 dans plus de 100 langues.

Notes et références[modifier | modifier le code]

↑ « Release 5.3.4 »

Articles connexes[modifier | modifier le code]

Transkribus

Liens externes[modifier | modifier le code]

(en) Announcing Tesseract OCR (Luc Vincent, Google Code Blog, août 2006)

Portail des logiciels libres

[wikidata-c28b7fbc152bd38cd254b3057376c003b7e81f36-1] « Release 5.3.4 »

[1]