Intelligence Artificielle et Réseaux de Graphes pour la Vulnérabilité des Communautés de Poissons en Milieu Fluvial Navigable

Offre de thèse

Date limite de candidature

16-05-2026

Date de début de contrat

01-10-2026

Directeur de thèse

CAMARA Baba Issa

Encadrement

Le doctorant sera accueilli au sein du laboratoire LCOMS (EA 7306) de l'Université de Lorraine, dans le cadre d'un encadrement conjoint assuré par deux enseignants-chercheurs HDR : Dr. Baba Issa CAMARA (MCF HDR, section CNU 26 — Mathématiques appliquées) et Dr. Frédéric BOUSEFSAF (MCF HDR, section CNU 27 — Informatique). Cet encadrement bicéphale, ancré à l'interface des mathématiques appliquées et de l'informatique, est pleinement cohérent avec les axes scientifiques de l'École Doctorale IAEM Lorraine (Informatique, Automatique, Électronique-Électrotechnique, Mathématiques), dont relève cette thèse. La thèse s'inscrit résolument dans les thématiques portées par IAEM : modélisation mathématique des réseaux d'interactions, apprentissage automatique sur graphes (Graph Neural Networks), traitement de séries temporelles par méthodes d'IA (T-GCN, LSTM), et intelligence artificielle explicable (XAI). Si le terrain applicatif est écologique, le cœur scientifique de la thèse est mathématique et informatique : construction formelle de graphes d'interaction, architectures neuronales profondes, inférence bayésienne hiérarchique (HMSC) et apprentissage de représentations. Le partenariat institutionnel avec VNF, les FDPPMA des départements 54, 57 et 88, et l'OFB garantit l'accès aux corpus de données nécessaires à l'entraînement et à la validation des modèles. Un comité de suivi individuel (CSI) se réunira au moins une fois par an conformément aux exigences de l'ED IAEM, afin d'évaluer l'avancement des travaux, la cohérence du plan de formation et le respect du calendrier. Des réunions régulières entre le doctorant et les deux encadrants assureront un suivi continu, notamment sur les développements algorithmiques et les choix d'architecture des modèles. Le plan de formation individuel intégrera des enseignements en apprentissage profond sur graphes (PyTorch Geometric), en mathématiques des réseaux, en statistiques bayésiennes et en IA explicable. La participation à des conférences nationales et internationales à dominante informatique et mathématiques appliquées (NeurIPS, ECML-PKDD, ESANN, GRETSI) est prévue dès la deuxième année.

Type de contrat

Concours pour un contrat doctoral

Candidater à cette offre

école doctorale

IAEM - INFORMATIQUE - AUTOMATIQUE - ELECTRONIQUE - ELECTROTECHNIQUE - MATHEMATIQUES

équipe

AXE IFLORSYS

contexte

Les communautés piscicoles constituent un bioindicateur central de la Directive Cadre sur l'Eau (DCE 2000/60/CE), évalué via l'Indice Poisson Rivière (IPR). Cependant, les approches réglementaires actuelles restent statiques et descriptives, incapables de capturer les dynamiques d'interaction entre espèces ou d'anticiper les trajectoires futures des communautés sous pression anthropique croissante. L'émergence des Graph Neural Networks (GNN) ouvre une voie radicalement nouvelle pour l'écologie des communautés. Contrairement aux méthodes statistiques classiques (GLM, GAM, ordination) ou aux modèles bayésiens hiérarchiques seuls (HMSC), les GNN modélisent explicitement la structure topologique du réseau d'interactions et capturent des dépendances non linéaires complexes à ordres d'interaction multiples. Appliqués à des données longitudinales de pêche électrique couvrant plus de 20 ans sur des dizaines de stations, ces algorithmes permettent d'aborder des questions écologiques jusqu'alors inaccessibles. La Moselle constitue un terrain d'étude exceptionnel : corridor navigable majeur concentrant l'ensemble des pressions anthropiques caractéristiques des voies d'eau aménagées, elle bénéficie d'un corpus de données tripartite sans équivalent — VNF, FDPPMA (dép. 54, 57, 88) et OFB/ASPE — couvrant plus de 20 ans de suivis annuels et fournissant la profondeur temporelle nécessaire à l'entraînement robuste d'architectures T-GCN.

spécialité

Informatique

laboratoire

LCOMS - Laboratoire de Conception, Optimisation et Modélisation des Systèmes

Mots clés

Réseaux de neurones sur graphes, Intelligence artificielle explicable, Communautés piscicoles, Dynamiques temporelles fluviales , Espèces invasives, Résilience écologique

Détail de l'offre

Les rivières navigables constituent des environnements écologiques complexes soumis à une superposition de pressions anthropiques : trafic fluvial commercial, régulation hydrologique, pollutions diffuses, espèces non-natives et changement climatique. La Moselle, corridor navigable majeur reliant la France, le Luxembourg et l'Allemagne, concentre l'ensemble de ces pressions tout en abritant des communautés piscicoles d'intérêt patrimonial élevé (truite fario, brochet, lamproie). Les approches réglementaires actuelles, fondées sur l'Indice Poisson Rivière (IPR) de la Directive Cadre sur l'Eau, évaluent l'état écologique de manière statique et descriptive, sans capturer les dynamiques d'interaction entre espèces ni anticiper les trajectoires futures des communautés sous pression croissante.
Cette thèse propose de dépasser ces limites en mobilisant des architectures d'intelligence artificielle avancées — Graph Neural Networks (GNN), Graph Attention Networks (GAT), Temporal Graph Convolutional Networks (T-GCN) et intelligence artificielle explicable (XAI) — pour modéliser explicitement la structure topologique du réseau d'interactions biotiques et ses évolutions temporelles. Le socle mathématique repose sur la modélisation bayésienne hiérarchique des communautés (HMSC), dont la matrice Oméga de corrélations résiduelles constitue le substrat formel du graphe d'interactions, combinée à l'apprentissage de représentations sur graphes et à l'inférence variationnelle (VGAE).
Le projet s'appuie sur un corpus de données exceptionnel, issu d'un partenariat tripartite : VNF (Voies Navigables de France), les FDPPMA des départements 54, 57 et 88 (≥ 20 ans de pêches électriques annuelles), et l'OFB via l'API Poisson ASPE (> 50 ans de données nationales). Ce corpus multi-sources permet d'entraîner des architectures T-GCN sur des séries temporelles longues, d'une profondeur rarement atteinte en écologie des communautés.
Neuf hypothèses scientifiques structurent le programme : identification des espèces keystones par centralité apprise (H1), propagation en cascade des perturbations (H2), modules fonctionnels co-vulnérables (H3), interactions latentes par VGAE (H4), rôle des traits fonctionnels via XAI (H5), impact différentiel du trafic de navigation sur le réseau biotique (H6), détection précoce de points de bascule écologiques dans l'espace d'embedding (H7), hétérogénéité spatiale longitudinale (H8), et propagation des espèces invasives par connectivité paysagère et navigation (H9).
Les livrables attendus comprennent cinq publications dans des revues internationales à comité de lecture, des outils opérationnels de biomonitoring déployables par VNF et les FDPPMA, ainsi qu'une contribution méthodologique originale à l'interface des mathématiques appliquées, de l'informatique et de l'écologie computationnelle.

Keywords

Graph Neural Networks, Explainable Artificial Intelligence, Fish communities, Riverine temporal dynamics , Invasive species , Ecological resilience

Subject details

Navigable rivers are ecologically complex environments subject to a distinctive combination of anthropogenic pressures: commercial vessel traffic, hydrological regulation, diffuse pollution, non-native species, and climate change. The Moselle River, a major navigable corridor linking France, Luxembourg, and Germany, concentrates all of these pressures while supporting fish communities of high conservation value (brown trout, pike, river lamprey). Current regulatory approaches based on the Fish-Based Index (FBI) of the Water Framework Directive assess ecological status in a static and descriptive manner, failing to capture species interaction dynamics or anticipate future community trajectories under increasing pressure. This thesis proposes to overcome these limitations by deploying advanced artificial intelligence architectures — Graph Neural Networks (GNN), Graph Attention Networks (GAT), Temporal Graph Convolutional Networks (T-GCN), and Explainable AI (XAI) — to explicitly model the topological structure of the biotic interaction network and its temporal evolution. The mathematical foundation rests on Hierarchical Models of Species Communities (HMSC), whose residual correlation matrix (Omega) provides the formal substrate of the interaction graph, combined with graph representation learning and variational inference (VGAE). The project draws on an exceptional multi-source dataset from a tripartite partnership: VNF (Voies Navigables de France), the FDPPMA of departments 54, 57 and 88 (≥ 20 years of annual electrofishing surveys), and the OFB via the ASPE Fish API (> 50 years of national data). This corpus enables T-GCN architectures to be trained on long time series of a temporal depth rarely achieved in community ecology. Nine scientific hypotheses structure the research programme: identification of keystone species via learned centrality (H1), cascading propagation of perturbations (H2), co-vulnerable functional modules (H3), latent interactions via VGAE (H4), functional trait contributions via XAI (H5), differential impact of vessel traffic on the biotic network (H6), early detection of ecological tipping points in the embedding space (H7), longitudinal spatial heterogeneity (H8), and invasive species propagation through landscape connectivity and navigation (H9). Expected deliverables include five publications in peer-reviewed international journals, operational biomonitoring tools deployable by VNF and the FDPPMA, and an original methodological contribution at the interface of applied mathematics, computer science, and computational ecology.

Profil du candidat

Le candidat sera titulaire d'un Master 2 en Informatique, Mathématiques Appliquées, Mathématiques et Informatique, Sciences des Données, ou Bioinformatique avec une forte composante algorithmique. Une double formation Biologie–Informatique ou un parcours IA pour les Sciences du Vivant sera particulièrement apprécié.
Compétences requises :

Programmation Python niveau intermédiaire à avancé (NumPy, Pandas, scikit-learn) et bases en R
Connaissances en apprentissage automatique : réseaux de neurones, modèles de régression, classification
Bases solides en mathématiques appliquées : algèbre linéaire, probabilités, statistiques inférentielles
Capacité à lire et produire des écrits scientifiques en anglais

Compétences souhaitées :

Apprentissage profond sur graphes (PyTorch Geometric, GNN) ou apprentissage profond en général (PyTorch)
Modélisation bayésienne ou hiérarchique (R, Stan, MCMC)
Notions d'écologie des communautés, de traits fonctionnels ou de biodiversité
Intérêt pour l'IA explicable (XAI) et l'interprétabilité des modèles

Qualités personnelles :

Autonomie, rigueur scientifique et curiosité interdisciplinaire
Capacité à travailler en interface entre partenaires académiques et opérationnels (VNF, FDPPMA, OFB)
Français courant, anglais scientifique opérationnel (lecture, rédaction, présentation)

Candidate profile

The successful candidate will hold a Master's degree (or equivalent) in Computer Science, Applied Mathematics, Data Science, or Bioinformatics with a strong algorithmic component. A dual background in Biology and Computer Science, or a specialisation in AI for Life Sciences, will be particularly valued.
Required skills:

Intermediate to advanced Python programming (NumPy, Pandas, scikit-learn) and basic R
Machine learning fundamentals: neural networks, regression models, classification
Solid foundations in applied mathematics: linear algebra, probability theory, statistical inference
Ability to read and produce scientific writing in English

Desired skills:

Graph deep learning (PyTorch Geometric, GNN) or deep learning in general (PyTorch)
Bayesian or hierarchical modelling (R, Stan, MCMC)
Familiarity with community ecology, functional traits, or biodiversity assessment
Interest in Explainable AI (XAI) and model interpretability

Personal qualities:

Autonomy, scientific rigour and interdisciplinary curiosity
Ability to work at the interface between academic and operational partners (VNF, FDPPMA, OFB)
Fluent French, operational scientific English (reading, writing, oral presentation)

Référence biblio

Ovaskainen, O. et al. (2017). How to make more out of community data? A conceptual framework and its implementation as models and software. Ecology Letters, 20(5), 561–576.
Kipf, T. N. & Welling, M. (2017). Semi-supervised classification with graph convolutional networks. ICLR 2017.
Veličkovi&#263;, P. et al. (2018). Graph attention networks. ICLR 2018.
Zhao, L. et al. (2019). T-GCN: A temporal graph convolutional network for traffic prediction. IEEE Transactions on Intelligent Transportation Systems, 21(9), 3848–3858.
Lundberg, S. M. & Lee, S. I. (2017). A unified approach to interpreting model predictions. NeurIPS 2017.
Ying, R. et al. (2019). GNNExplainer: Generating explanations for graph neural networks. NeurIPS 2019.
Blanchet, F. G. et al. (2020). Co-occurrence is not evidence of ecological interactions. Ecology Letters, 23(7), 1050–1063.
Strayer, D. L. et al. (2004). Long-term ecological dynamics of the zebra mussel invasion. BioScience, 54(1), 29–37.
Pont, D. et al. (2006). Assessing river biotic condition at a continental scale: a European approach using functional metrics and fish assemblages. Journal of Applied Ecology, 43(1), 70–80.
Scheffer, M. et al. (2009). Early-warning signals for critical transitions. Nature, 461, 53–59.
Hamilton, W. L. et al. (2017). Inductive representation learning on large graphs (GraphSAGE). NeurIPS 2017.
Kipf, T. N. & Welling, M. (2016). Variational graph auto-encoders. NeurIPS Workshop 2016.