Apache CTAKES

Un article de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche

Apache cTAKES:clinical Text Analysis and Knowledge Extraction System est un système open source de traitement du langage naturel pour l'extraction d'informations à partir d'un dossier de santé électronique. Il traite des notes cliniques, identifier les types de cliniques entités nommées — médicaments, des maladies ou troubles, les signes/symptômes, anatomical sites and procedures. Chaque entité nommée a les attributs pour une zone de texte , l'ontologie du code de mappage, le contexte (histoire de famille, le courant, sans rapport avec le patient), et nié / non négligé.

CTAKES a été construit en utilisant UIMA Unstructured Information Management Architecture framework (en) et OpenNLP (en) . Ses composants sont spécialement entrainés pour le domaine clinique et créent des annotations linguistiques et sémantiques riches qui peuvent être utilisées par les systèmes cliniques d'aide à la décision et la recherche clinique.

Ces composants incluent:

  • Sentence boundary detector
  • Rule-based tokenizer to separate punctuations from words
  • Normalisateur
  • Context dependent tokenizer
  • Part-of-speech tagger
  • Phrasal chunker
  • Dictionary lookup annotator
  • Contexte l'annotateur
  • détecteur de négation
  • Dependency parser
  • Module for the identification of patient smoking status
  • Drug mention annotator

L'histoire[modifier | modifier le code]

Le développement de cTAKES débuté en 2006 par une équipe de médecins, d'informaticiens et des ingénieurs logiciels à la Clinique Mayo. L'équipe de développement a été dirigée par le Dr Guergana Savova & Dr Christopher Chute. Ce système a été déployé à Mayo et fait actuellement une partie intégrante de leurs données cliniques et de l'infrastructure de gestion qui traite plus de 80 millions de notes cliniques.

Actuellement, l'équipe de développement est situé à la Mayo Clinic et de l'Hôpital pour Enfants de Boston après le déménagement du Dr Savova à l'Hôpital pour enfants de Boston au début de 2010. Des collaborations supplémentaires avec des groupes externes à l'Université du Colorado, à l'Université Brandeis, à l'Université de Pittsburgh, à l'Université de Californie à San Diego, continuent d'étendre les capacités de cTAKES dans des domaines tels que le raisonnement temporel, la réponse aux questions cliniques et la résolution coreference pour le domaine clinique.

En 2010, cTAKES a été adopté par le programme i2b2 et est un élément central de la SHARPn Area 4

En 2013, cTAKES sort une premiere version en incubateur sous le nom : cTAKES 3.0

En Mars 2013, cTAKES devient un Projet Top Level  (TLP)

Voir aussi[modifier | modifier le code]

Liens externes[modifier | modifier le code]