Tesseract (logiciel)

Un article de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche
Page d'aide sur l'homonymie Pour les articles homonymes, voir Tesseract (homonymie).
Tesseract
Description de l'image TesseractLogo.png.
Description de l'image Tesseract-3.03.png.
Informations
Développé par Google et Hewlett-PackardVoir et modifier les données sur Wikidata
Dernière version 4.1.0 ()[1]Voir et modifier les données sur Wikidata
Dépôt github.com/tesseract-ocr/tesseractVoir et modifier les données sur Wikidata
Écrit en C++Voir et modifier les données sur Wikidata
Système d'exploitation Linux, Microsoft Windows et macOSVoir et modifier les données sur Wikidata
Environnement Linux, OpenBSD, Mac OS X, Windows
Formats écrits HOCR (en), fichier texte, Portable Document Format et ALTO (XML)Voir et modifier les données sur Wikidata
Type OCR
Licence Apache
Site web https://github.com/tesseract-ocr/tesseract

Tesseract est un logiciel de reconnaissance optique de caractères sous licence Apache.

Conçu par les ingénieurs de Hewlett Packard de 1985 à 1995, son développement est abandonné pendant les dix années suivantes ; en 2005, les sources du logiciel sont publiées sous licence Apache et Google poursuit son développement. Initialement limité aux caractères ASCII, il reconnaît les caractères UTF-8 dans plus de 100 langues.

Notes et références[modifier | modifier le code]

  1. « Release 4.1.0 » (consulté le 8 juillet 2019)

Liens externes[modifier | modifier le code]