Extraction de connaissances

Cet article est une ébauche concernant le Web sémantique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) — pour plus d’indications, visitez le projet Web Sémantique.

L'extraction de connaissances est le processus de création de connaissances à partir d'informations structurées (bases de données relationnelles, XML) ou non structurées (textes, documents, images). Le résultat doit être dans un format lisible par les ordinateurs.

Le groupe RDB2RDF W3C^[1] est en cours de standardisation d'un langage d'extraction de connaissances au format RDF à partir de bases de données.

En français on parle d'« extraction de connaissances à partir des données » (ECD)^[2].

Description[modifier | modifier le code]

L'extraction de connaissances se déroule en plusieurs étapes, avant le « data mining » (Exploration de données) proprement dit.

Le prétraitement consiste à construire des corpus de données spécifiques et met en forme les données suivant leur type (textes, images, sons, etc.)^[3]. Suit une phase de nettoyage des données, et de traitement des données éventuellement manquantes.

Outils[modifier | modifier le code]

Cette section est vide, insuffisamment détaillée ou incomplète. Votre aide est la bienvenue ! Comment faire ?

Notes et références[modifier | modifier le code]

↑ « RDB2RDF Working Group », sur w3.org (consulté le 15 novembre 2023).
↑ https://www.cairn.info/revue-francaise-de-gestion-2003-5-page-59.htm
↑ « Extraction de connaissances à partir de données (ECD) », sur ingenieur.fr, 10 novembre 2002 (consulté le 17 août 2020).

Voir aussi[modifier | modifier le code]

Bibliographie[modifier | modifier le code]

Collectif Cépaduès, Extraction et gestion des connaissances - EGC'2009 : Actes des neuvièmes journées Extraction et Gestion des Connaissances (EGC'2009), Paris, Eyrolles, coll. « Revue des Nouvelles Technologies de l'Information », janvier 2009, 518 p. (ISBN 9782854288780).
Processus d'extraction de connaissances à partir de données: Représentation et gestion des connaissances multi-points de vue, EL Moukhtar Zemmouri, PAF, 2014 (ISBN 9783838140483).

Articles connexes[modifier | modifier le code]

Liens externes[modifier | modifier le code]

(en) « Knowledge Extraction Based on Discourse Representation Theory and Linguistic_Frames », sur researchgate.net, octobre 2012

Portail du Web sémantique

[1] « RDB2RDF Working Group », sur w3.org (consulté le 15 novembre 2023).

[2] ttps://www.cairn.info/revue-francaise-de-gestion-2003-5-page-59.htm

[3] « Extraction de connaissances à partir de données (ECD) », sur ingenieur.fr, 10 novembre 2002 (consulté le 17 août 2020).

[1]

[2]

[3]