Apache Ctakes

Informations
Développé par	Mayo Clinic et Apache Software Foundation
Première version	20 mars 2013
Dernière version	5.1.0 (16 mai 2024)
Dépôt	github.com/apache/ctakes
Écrit en	Java, Scala et Python
Système d'exploitation	Multiplateforme
Type	Traitement automatique des langues; Gestion de contenu (en); Bibliothèque logicielle
Licence	Licence Apache
Site web	github.com/apache/ctakes?tab=readme-ov-file#apache-ctakes

Apache Ctakes est un logiciel open source de traitement du langage naturel permettant l'extraction d'informations à partir d'un dossier de santé électronique. Il traite des notes cliniques, identifie les noms des types d'entités cliniques (médicaments), les troubles et maladies, les signes/symptômes, les localisations anatomiques et des procédures. Chaque entité nommée est attribuée à une zone de texte, l'ontologie du code de mappage, le contexte (histoire de famille, le courant, sans rapport avec le patient), etc.

Ctakes a été élaboré en utilisant UIMA (en) et OpenNLP (en) (pour Unstructured Information Management Architecture framework. Ses composants sont adaptés au domaine clinique et créent des annotations linguistiques et sémantiques riches pouvant être utilisées par les systèmes cliniques d'aide à la décision et la recherche clinique. Il est baptisé cTAKES par ses auteurs, pour clinical Text Analysis and Knowledge Extraction System.

Ces composants incluent, entre autres :

un détecteur de fin de phrase ;
une fonction distinguant les mots de la ponctuation ;
un normalisateur ;
un détecteur de dépendance contextuelle ;
la détection d'extrait de commentaires ;

l'annotation de contexte ;
un détecteur de négation ;

l'annotation des recherches en dictionnaires ;
un module relatif à la dépendance du patient au tabac ;
l'annotation de dépendance à la drogue.

L'histoire

Le développement de Ctakes débuté en 2006 par une équipe de médecins, d'informaticiens et des ingénieurs logiciels à la Mayo Clinic, aux États-Unis. L'équipe de développement était dirigée par les docteurs Guergana Savova et Christopher Chute. Ce système a été déployé à Mayo et fait actuellement une partie intégrante de leurs données cliniques et de l'infrastructure de gestion qui traite plus de 80 millions de notes cliniques.

Actuellement, l'équipe de développement est située à la Mayo Clinic et au Boston Children's Hospital, l'hôpital pour enfants de Boston, après le déménagement du Dr Savova vers cette unité en 2010. Des collaborations supplémentaires avec des groupes extérieurs (des universités du Colorado, de Brandeis, de Pittsburgh (Pennsylvanie), de l'université de Californie à San Diego) continuent d'étendre les capacités de Ctakes dans des domaines tels que le raisonnement temporel, la réponse aux questions cliniques et la résolution coréférence pour le domaine clinique.

En 2010, Ctakes a été adopté par le programme i2b2^[3] et constitue un élément central de la SHARPn Area 4^[4]

En 2013, Ctakes sort une premiere version en incubateur sous la désignation Ctakes 3.0^[5]

En Mars 2013, Ctakes devient un Projet Top Level (TLP).

Références

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Apache cTAKES » (voir la liste des auteurs).

↑ « https://projects.apache.org/json/projects/ctakes.json » (consulté le 8 avril 2020)
↑ « Release 5.1.0 », 16 mai 2024 (consulté le 18 mai 2024)
↑ Site internet du programme i2b2.
↑ Page internet sur SHARPn Area 4.
↑ cTAKES 3.0

Voir aussi

Liens externes

[wikidata-3d848677de999a4ac970fd33d1f7fca56b1fc02f-1] « https://projects.apache.org/json/projects/ctakes.json » (consulté le 8 avril 2020)

[wikidata-5e0a59fddec6238b69ffdeaf28dd3cfb4649dd2d-2] « Release 5.1.0 », 16 mai 2024 (consulté le 18 mai 2024)

[3] Site internet du programme i2b2.

[4] Page internet sur SHARPn Area 4.

[5] TAKES 3.0

[1]

[2]

[3]

[4]

[5]