Apache Tika

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Pour les articles homonymes, voir Tika.
Apache Tika
Image illustrative de l'article Apache Tika

Développeur Apache Software FoundationVoir et modifier les données sur Wikidata
Dernière version 1.14 ()[1]Voir et modifier les données sur Wikidata
Écrit en JavaVoir et modifier les données sur Wikidata
Licence Apache-2.0Voir et modifier les données sur Wikidata
Site web tika.apache.orgVoir et modifier les données sur Wikidata

Apache Tika est un toolkit développé par la fondation Apache qui permet de détecter, d'extraire des métadonnées, et de structurer le contenu textuel de nombreux types de documents (gzip, .mid, .pdf, tar, zip,...)[2].

Ce projet dépendant de l'Apache Software Foundation, était auparavant un sous-projet de Apache Lucene.

Notes et références[modifier | modifier le code]

Liens externes[modifier | modifier le code]