Ressources lexicales et TAL : de l'enrichissement de réseaux lexico-sémantiques du français à la génération de plongements de graphe pour la désambiguïsation lexicale
Lexical resources and NLP: from enriching French lexical-semantic networks to generating graph embeddings for word sense disambiguation
Jury
Directeur de these_CONSTANT_Mathieu_ATILF / Université de Lorraine
Rapporteur_LANGLAIS_Philippe_Université de Montréal
CoDirecteur de these_FORT_Karën_LORIA / Université de Lorraine
Rapporteur_SéBILLOT_Pascale_IRISA / INSA Rennes
Examinateur_BARQUE_Lucie_Université Sorbonne Paris Nord
Examinateur_LAFOURCADE_Mathieu_Université Montpellier II
Examinateur_GARDENT_Claire_LORIA
école doctorale
SLTC - SOCIETES, LANGAGES, TEMPS, CONNAISSANCES
Laboratoire
ATILF - Analyse et Traitement Informatique de la Langue Française
Mention de diplôme
Sciences du langage
Salle A008
Campus Scientifique, 615 Rue du Jardin-Botanique, 54506 Vandœuvre-lès-Nancy
Mots clés
ressources lexicales,réseaux lexico-sémantiques,plongement de graphe,désambiguisation lexicale,évaluation,
Résumé de la thèse
Cette thèse explore la relation bilatérale qui unit les ressources lexicales et le Traitement Automatique des Langues (TAL). Historiquement, les ressources lexicales symboliques, telles que les dictionnaires et les réseaux lexico-sémantiques, constituaient les fondations des systèmes de TAL. Cependant, l'essor de l'apprentissage profond et des grands modèles de langue a provoqué un changement de paradigme majeur vers des représentations implicites et numériques, apprises à partir de grandes quantités de données.
Keywords
lexical resources,lexical-semantic networks,graph embeddings,word sense disambiguation,evaluation,
Abstract
This thesis explores the bilateral relationship between lexical resources and Natural Language Processing (NLP). Historically, symbolic lexical resources, such as dictionaries and lexical-semantic networks, formed the foundation of NLP systems. However, the rise of deep learning and large language models has caused a major paradigm shift towards implicit, numerical representations learned from large amounts of data.