Sommaire

Extraction de connaissances Analyse de contenus:extraction de connaissances

1. Vue d’ensemble

L’extraction de connaissances est un des piliers de l’analyse de contenus. Elle consiste à identifier puis à extraire d’un corpus documentaire de manière totalement automatique les « éléments » jugés les importants. Analyse de contenus:extraction de connaissances

Ces « éléments » peuvent être regroupés en quatre grandes catégories :

  • entités nommées (noms de personnes, d’entreprises, de lieux, etc.) ;

  • mots-clés ou expressions : il s’agit des termes qui ne relèvent pas de la catégorie des entités nommées ;

  • concepts : il s’agit de représentations abstraites d’objets (le concept de véhicule peut être exprimé par différents mots-clés tels que « voiture », « auto », « moto », etc.) ;

  • relations entre des entités nommées, mots ou expression : une personne dirige une entreprise, une entreprise qui rachète une autre entreprise, une implantation d’entreprise dans un pays, etc.

Si l’extraction d’entités nommées et/ou de mots-clés et expressions est le processus le plus simple et le plus commun de la fonction d’extraction de connaissances, ce n’est pas le cas de l’extraction ...