14h00

Soutenance de thèse de HEE-SOO CHOI

Ressources lexicales et TAL : de l'enrichissement de réseaux lexico-sémantiques du français à la génération de plongements de graphe pour la désambiguïsation lexicale

Lexical resources and NLP: from enriching French lexical-semantic networks to generating graph embeddings for word sense disambiguation

Jury

Directeur de these_CONSTANT_Mathieu_ATILF / Université de Lorraine
Rapporteur_LANGLAIS_Philippe_Université de Montréal
CoDirecteur de these_FORT_Karën_LORIA / Université de Lorraine
Rapporteur_SéBILLOT_Pascale_IRISA / INSA Rennes
Examinateur_BARQUE_Lucie_Université Sorbonne Paris Nord
Examinateur_LAFOURCADE_Mathieu_Université Montpellier II
Examinateur_GARDENT_Claire_LORIA

école doctorale

SLTC - SOCIETES, LANGAGES, TEMPS, CONNAISSANCES

Laboratoire

ATILF - Analyse et Traitement Informatique de la Langue Française

Mention de diplôme

Sciences du langage
Salle A008 Campus Scientifique, 615 Rue du Jardin-Botanique, 54506 Vandœuvre-lès-Nancy
*

Mots clés

ressources lexicales,réseaux lexico-sémantiques,plongement de graphe,désambiguisation lexicale,évaluation,

Résumé de la thèse

Cette thèse explore la relation bilatérale qui unit les ressources lexicales et le Traitement Automatique des Langues (TAL). Historiquement, les ressources lexicales symboliques, telles que les dictionnaires et les réseaux lexico-sémantiques, constituaient les fondations des systèmes de TAL. Cependant, l'essor de l'apprentissage profond et des grands modèles de langue a provoqué un changement de paradigme majeur vers des représentations implicites et numériques, apprises à partir de grandes quantités de données.

Keywords

lexical resources,lexical-semantic networks,graph embeddings,word sense disambiguation,evaluation,

Abstract

This thesis explores the bilateral relationship between lexical resources and Natural Language Processing (NLP). Historically, symbolic lexical resources, such as dictionaries and lexical-semantic networks, formed the foundation of NLP systems. However, the rise of deep learning and large language models has caused a major paradigm shift towards implicit, numerical representations learned from large amounts of data.