La construction automatique de ressources multilingues à partir des réseaux sociaux : Application aux données dialectales du Maghreb.
Automatic building of multilingual resources from social networks: Application to Maghreb dialects.
Jury
Directeur de these - SMAILI - Kamel - Université de Lorraine
CoDirecteur de these - LANGLOIS - david - Université de Lorraine
Examinateur - JOUVET - Denis - Université de Lorraine
Rapporteur - ESTèVE - Yannick - Université d'Avignon
Rapporteur - BOUZOUBAA - Karim - Université Mohammed-V
Examinateur - HABACHA - Anja - Université de Tunis
école doctorale
IAEM - INFORMATIQUE - AUTOMATIQUE - ELECTRONIQUE - ELECTROTECHNIQUE - MATHEMATIQUES
Laboratoire
LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Mention de diplôme
Informatique
C005
Laboratoire lorraine de recherche en informatique et ses applications (Loria), Campus Scientifique, 615 Rue du Jardin-Botanique, 54506 Vanduvre-lès-Nancy
Mots clés
Dialectes du Maghreb,Arabe standard,Comparabilité,Analyse de sentiments,Word emebdding,Appraisal
Résumé de la thèse
Le traitement automatique des langues est fondé sur l'utilisation des ressources langagières telles que les corpus de textes, les dictionnaires, les lexiques de sentiments, les analyseurs morpho-syntaxiques, les taggers, etc. Pour les langues naturelles, ces ressources sont souvent disponibles. En revanche, lorsqu'il est question de traiter les langues peu dotées, on est souvent confronté au manque d'outils et de données. Dans cette thèse, on s'intéresse à certaines formes vernaculaires de l'arabe utilisées au Maghreb.
Keywords
Maghreb Dialects,Modern Standard Arabic,Comparability,Sentiment Analysis,Word emebdding,Appraisal
Abstract
Automatic language processing is based on the use of language resources such as corpora, dictionaries, lexicons of sentiments, morpho-syntactic analyzers, taggers, etc. For natural languages, these resources are often available. On the other hand, when it comes to dealing with under-resourced languages, there is often a lack of tools and data. In this thesis, we are interested in some of the vernacular forms of Arabic used in Maghreb. These forms are known as dialects, which can be classified as poorly endowed languages.