Axe 5 : Analyse sémantique computationnelle

Responsable : Thierry Charnois, LIPN Paris 13

 

Co-responsable : Benoît Crabbé LLF Université de Paris

pexels-photo-160107-768x512.jpeg

Dans le champ de la linguistique computationnelle, l’axe 5 met l’accent sur l’analyse sémantique et son application dans divers outils d’accès au contenu (ex. extraction d‘information, indexation, résumé), qui peuvent reposer sur des représentations sémantiques différentes. Des modèles, des méthodes et calculs et – dans certains cas – des outils ont été proposés pour décrire et modéliser différents phénomènes sémantiques mais ces phénomènes ont généralement été considérés isolément et avec des modèles de calculs hétérogènes. Le défi consiste à évaluer ces différents modèles sémantiques, à les opérationnaliser et à les intégrer pour produire des analyses sémantiques riches, couvrantes et cohérents, de la même manière que l’on a pu produire des analyseurs syntaxiques à la fois robuste et de bonne qualité.

 

L’objectif est d’intensifier la recherche sur l’intégration des modèles et méthodes sémantiques par la collaboration de différentes équipes de linguistique computationnelle (Alpage, Lattice, LIPN, LPP-P3) et la confrontation de leurs résultats hétérogènes sur l’analyse syntaxique, l’analyse textuelle, l’analyse et le traitement de corpus, le raisonnement inférentiel basé sur les textes, l’acquisition de connaissances à partir de textes, l’apprentissage automatique et les outils d’accès aux contenus textuels.

 

L’axe 5 met l’accent sur l’analyse du français mais une attention particulière est portée à l’identification de méthodes indépendantes de la langue qui permettent d’analyser une large palettes de langues pour lesquelles des ressources sont disponibles. C’est en effet une approche prometteuse pour équiper des langues peu outillées qui sont utilisées dans les axes 2 et 3.

 

L’axe s’intéresse à la langue écrite et orale. Les besoins d’analyse de la langue parlée augmentent et l’un des défis à relever consiste à intégrer dans l’analyse sémantique des traits de l’oral comme les dysfluences pour compenser la faiblesse de la qualité des résultats obtenus sur des transcriptions de l’oral.

 

L’axe comporte 6 sous-axes :
 

  • Perspective historique et réflexive (HP)

  • Constitution et annotation de corpus pour l’analyse sémantique (IA)

  • Apprentissage semi-supervisé pour l’analyse syntaxique profonde (SSL)

  • Analyses et traitements sémantiques spécifiques (SSP)

  • Méthodes d’acquisition de connaissances (KA)

  • Applications: vers un accès enrichi aux contenus textuels (APP)

     

Opérations de l’Axe 5 (2020-2024)

 

SSL5 Shallow semantic analysis

Marie Candito (LLF) – Joseph Leroux (LIPN)

 

SSL6 Semi-supervised Semantic Analysis

Joseph Leroux (LIPN)

 

SSL7 MetaSem: Towards more semantic metagrammars

Djamé Seddah – Eric de la Clergerie

 

SPP6 Word sense disambiguation and sense induction

Lucie Barque – Marie Candito (LLF)

 

SPP7 Computational and Cognitive modeling of the processing of syntactic and semantic information

Benoît Crabbé (LLF)

 

KA2/APP2 Extraction of semantic relations and applications

Haïfa Zargayouna (LIPN)

APP4 RENFO: Expert research on the web through semantic extraction of bio-professional traces from the web

Jorge Garcia Flores (LIPN)

 

APP5 When Aliens meet Predators : Building Context-Enhanced NLP Tools

Djamé Seddah

 

APP6 Geo-NN: Geolocalisation in Social Media using Deep Neural Networks

Davide Buscaldi (LIPN)

 

APP7 Legal rule analysis

Adeline Nazarenko (LIPN)

 

HRP2 Graph-based semantic analysis

Adeline Nazarenko (LIPN)

 

KA5 Cross-lingual and multilingual alignment of semantic Resources

Haïfa Zargayouna (LIPN)

Présentation de l'Axe 5 en vidéo