ABIDI Karima


10h00

Soutenance de thèse de Karima ABIDI

La construction automatique de ressources multilingues à partir des réseaux sociaux : Application aux données dialectales du Maghreb.

Automatic building of multilingual resources from social networks: Application to Maghreb dialects.

Jury

Directeur de these - SMAILI - Kamel - Université de Lorraine
CoDirecteur de these - LANGLOIS - david - Université de Lorraine
Examinateur - JOUVET - Denis - Université de Lorraine
Rapporteur - ESTèVE - Yannick - Université d'Avignon
Rapporteur - BOUZOUBAA - Karim - Université Mohammed-V
Examinateur - HABACHA - Anja - Université de Tunis

école doctorale

IAEM - INFORMATIQUE - AUTOMATIQUE - ELECTRONIQUE - ELECTROTECHNIQUE - MATHEMATIQUES

Laboratoire

LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications

Mention de diplôme

Informatique
C005 Laboratoire lorraine de recherche en informatique et ses applications (Loria), Campus Scientifique, 615 Rue du Jardin-Botanique, 54506 Vandœuvre-lès-Nancy
*

Mots clés

Dialectes du Maghreb,Arabe standard,Comparabilité,Analyse de sentiments,Word emebdding,Appraisal

Résumé de la thèse

Le traitement automatique des langues est fondé sur l'utilisation des ressources langagières telles que les corpus de textes, les dictionnaires, les lexiques de sentiments, les analyseurs morpho-syntaxiques, les taggers, etc. Pour les langues naturelles, ces ressources sont souvent disponibles. En revanche, lorsqu'il est question de traiter les langues peu dotées, on est souvent confronté au manque d'outils et de données. Dans cette thèse, on s'intéresse à certaines formes vernaculaires de l'arabe utilisées au Maghreb.

Keywords

Maghreb Dialects,Modern Standard Arabic,Comparability,Sentiment Analysis,Word emebdding,Appraisal

Abstract

Automatic language processing is based on the use of language resources such as corpora, dictionaries, lexicons of sentiments, morpho-syntactic analyzers, taggers, etc. For natural languages, these resources are often available. On the other hand, when it comes to dealing with under-resourced languages, there is often a lack of tools and data. In this thesis, we are interested in some of the vernacular forms of Arabic used in Maghreb. These forms are known as dialects, which can be classified as poorly endowed languages.