|
|
# TENET (Tool for Extraction using Net Extension by (semantic) Transduction)
|
|
|
|
|
|
Tenet est un composant logiciel, générique et _open source_, qui peut être associée à d'autres composants pour construire des ontologies OWL à partir de textes écrits en langue naturelle (LN). Cet outil implémente un procédé d’extraction, basé sur le concept de transduction sémantique compositionnelle [1], en s'appuyant sur les standards du Web Sémantique du W3C (RDF, OWL, SPARQL, SHACL).
|
|
|
TENET est un composant logiciel, générique et _open source_, qui peut être associée à d'autres composants pour construire des ontologies OWL à partir de textes écrits en langue naturelle (LN). Cet outil implémente un procédé d’extraction, basé sur le concept de transduction sémantique compositionnelle [1], en s'appuyant sur les standards du Web Sémantique du W3C (RDF, OWL, SPARQL, SHACL).
|
|
|
|
|
|
Une représentation pivot, prenant la forme d'un graphe sémantique, est exploitée en entrée de TENET. [TODO: expliquer comment obtenir cette structure en utilisant un analyseur linguistique]
|
|
|
La construction automatique d’ontologies peut être structurée autour de différentes tâches complémentaires, en commençant par l’extraction de la terminologie jusqu’à la mise en évidence de relations et de propriétés complexes entre des concepts hiérarchisés. Dans cette optique,
|
|
|
une chaîne de traitement globale peut être proposée, partant d’énoncés exprimés en langue naturelle pour aboutir à une ontologie représentant l'ensemble de connaissances décrites par ces énoncés. Cette chaîne est composée de plusieurs étapes : (1) la conversion des énoncés en langue naturelle dans une représentation sémantique pivot, (2) la sérialisation RDF des représentations
|
|
|
obtenues, (3) l’extraction du contenu sémantique pour construire une ontologie OWL et (4) l'exploitation de l'ontologie produite en fonction du besoin applicatif.
|
|
|
|
|
|
[TODO: expliquer le fonctionnement de TENET]
|
|
|
L'extracteur TENET correspond la troisième étape d'une telle chaîne. Il requiert, en entrée, une ontologie cadre et un ensemble de structures pivot représentant le document à traiter. La sortie est un ensemble de triplets RDF-OWL enrichissant et instanciant l’ontologie cadre.
|
|
|
|
|
|
La structure pivot peut être produite en utilisant un analyseur linguistique, puis adaptée à l'aide d'un outil de sérialisation RDF. L'outil prend actuellement en charge les graphes du langage UNL [2] dans le format **UNL-RDF**.
|
|
|
|
|
|
L’analyse des structures pivot (UNL) est guidée par des schémas de transduction compositionnelle, implémentés sous la forme de requêtes SPARQL-construct. Ces règles dépendent fortement de la structure des graphes sémantiques en entrée, c’est à dire du formalisme UNL et des spécificités du corpus (syntaxe, registre, style, parfois phraséologie). En revanche, elles sont génériques du point de vue du contenu métier des phrases, qui est précisé au niveau de l’ontologie cadre.
|
|
|
|
|
|
[TODO: plan du wiki]
|
|
|
|
|
|
------------------------------------------------------------------
|
|
|
[1] Lamercerie, A. (2021). _Principe de transduction sémantique pour l’application de théories
|
|
|
d’interfaces sur des documents de spécification_. Thèse, Université de Rennes 1. |
|
|
\ No newline at end of file |
|
|
d’interfaces sur des documents de spécification_. Thèse, Université de Rennes 1.
|
|
|
[2] UNL Specification 3.3 (2004). `http ://www.unlweb.net/wiki/images/a/ab/Spec33.pdf`. |
|
|
\ No newline at end of file |