Apprentissage actif multimodal explicable pour l'exploration de structures latentes en intelligence artificielle

Offre de thèse

Date limite de candidature

30-04-2026

Date de début de contrat

01-10-2026

Directeur de thèse

BOUDJELOUD-ASSALA Baya Lydia

Encadrement

50%-50%

Type de contrat

Concours pour un contrat doctoral

Candidater à cette offre

école doctorale

IAEM - INFORMATIQUE - AUTOMATIQUE - ELECTRONIQUE - ELECTROTECHNIQUE - MATHEMATIQUES

équipe

ORPAILLEUR

contexte

Ce projet de thèse, porté par le laboratoire LORIA, vise à développer des méthodes innovantes d'apprentissage automatique multimodal, actif et explicable. Il bénéficiera d'un cadre expérimental et de données réelles fournies par le LEM3 (Laboratoire d'Études des Microstructures et de Mécaniques des Matériaux, Metz), dans le contexte des projets ANR MAMIENOVA et IMP3D. Ces données comprennent des images microscopiques haute résolution (EBSD, ECCI), des cartes cristallographiques et des champs de contraintes issus de simulations de plasticité cristalline. Elles permettront de tester et valider concrètement les approches d'IA développées, en complément des contributions théoriques attendues. Au-delà des matériaux, la méthodologie proposée est générique et transférable à de nombreux domaines où l'acquisition de données est coûteuse et où la prise de décision doit tenir compte de l'incertitude.

spécialité

Informatique

laboratoire

LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications

Mots clés

Apprentissage Actif, Explicabilité, Incertitudes, Sobriété numérique

Détail de l'offre

La recherche en apprentissage automatique s'est longtemps concentrée sur l'amélioration des performances des
modèles. Cependant, avec les récentes avancées en intelligence artificielle et son intégration dans un nombre
croissant de systèmes parfois critiques pour la sécurité, de nouveaux défis apparaissent. L'attention se porte
désormais sur les coûts écologiques, économiques et sociétaux de l'IA [1], ainsi que sur la nécessité de développer
des modèles plus sobres et fiables. Pour des systèmes atteignant déjà des performances proches de l'optimal,
il devient crucial de quantifier et de communiquer l'incertitude [2], en particulier pour des prédictions rares
mais critiques, où un seul échec peut avoir de graves conséquences. Parallèlement, l'utilisation généralisée de
modèles “boîte noire” soulève des questions de confiance et d'interprétabilité, notamment lorsque les modèles
sont surconfiants.
Le premier objectif scientifique de cette thèse est de développer des méthodes d'apprentissage actif multimodal,
explicables et économe en données [3] pour identifier des paramètres latents qui ne sont pas explicitement
modélisés dans les simulateurs actuels, en comparant les prédictions simulées avec les observations expérimentales.
Les stratégies d'apprentissage actif [4] guideront l'acquisition des échantillons expérimentaux les plus
informatifs en combinant l'incertitude du modèle, le décalage simulateur–réalité et l'expertise du LEM3, tout
en minimisant le coût expérimental.
Le second objectif est d'explorer un paradigme alternatif sans simulation, dans lequel les modèles prédiraient
directement la déformation des matériaux à partir d'images. À partir d'une image microstructurale initiale et
des conditions de charge, le modèle apprendra à prédire la microstructure déformée. Cette approche permet
de capturer des phénomènes complexes non modélisés tout en restant efficace en calcul, offrant des prédictions
rapides là où les simulations classiques par éléments finis sont trop coûteuses ou imprécises. Des architectures
multimodales combineront images, métadonnées et éventuellement sorties de simulateurs, tandis que des mécanismes
d'explicabilité intégrés [5, 6] permettront aux experts de valider les prédictions par rapport à l'intuition
physique.
La sobriété et l'efficacité énergétique sont des préoccupations centrales du projet. Des architectures légères,
la sélection active des données et la compression des modèles seront mises en œuvre pour limiter l'empreinte computationnelle.
Les résultats attendus incluent des simulateurs physiques enrichis par de nouveaux paramètres,
une réduction significative des campagnes expérimentales grâce à l'acquisition ciblée de données, et le développement
d'un cadre d'IA robuste et explicable.
Cette thèse vise à exploiter des données expérimentales et de simulation riches issues des projets ANR
MAMIENOVA et IMP3D, fournies par le LEM3 (Laboratoire d'Études des Microstructures et de Mécaniques
des Matériaux, Metz), afin d'identifier et de caractériser les paramètres latents gouvernant la plasticité des
matériaux métalliques, dans un contexte d'apprentissage automatique innovant. Les données incluent des images
microscopiques haute résolution (EBSD, ECCI), des cartes cristallographiques et des champs de contraintes issus
de simulations de plasticité cristalline [7].
Au-delà des matériaux, la méthodologie proposée est générique et transférable à de nombreux domaines
où l'acquisition de données est coûteuse et où la prise de décision doit tenir compte de l'incertitude. Elle
pourrait notamment contribuer à réduire les coûts sociétaux et environnementaux liés aux systèmes IA à grande
échelle [8], ou à améliorer la détection de maladies dans des contextes multimodaux coûteux, tels que des EEG,
IRM ou cultures microbiologiques, où des stratégies d'apprentissage actif, explicable et économe en données
sont particulièrement pertinentes [3].

Keywords

active learning, explainable AI, uncertainty, sobriety

Subject details

Machine learning research has long focused on improving model performance. However, with recent advances in artificial intelligence and its integration into a growing number of systems, some of which are safety-critical, new challenges are emerging. Attention is now turning to the ecological, economic, and societal costs of AI [1], as well as the need to develop more sober and reliable models. Attention is now turning to the ecological, economic, and societal costs of AI [1], as well as the need to develop more efficient and reliable models. For systems already achieving near-optimal performance, it is becoming crucial to quantify and communicate uncertainty [2], particularly for rare but critical predictions, where a single failure can have serious consequences. At the same time, the widespread use of “black box” models raises questions of trust and interpretability, especially when models are overconfident. The first scientific objective of this thesis is to develop multimodal active learning methods that are explainable and data-efficient [3] to identify latent parameters that are not explicitly modeled in current simulators, by comparing simulated predictions with experimental observations. Active learning strategies [4] will guide the acquisition of the most informative experimental samples by combining model uncertainty, simulator-reality gap, and LEM3 expertise, while minimizing experimental cost. The second objective is to explore an alternative paradigm without simulation, in which models would directly predict material deformation from images. From an initial microstructural image and loading conditions, the model will learn to predict the deformed microstructure. This approach allows complex unmodeled phenomena to be captured while remaining computationally efficient, offering rapid predictions where conventional finite element simulations are too costly or inaccurate. Multimodal architectures will combine images, metadata, and possibly simulator outputs, while integrated explainability mechanisms [5, 6] will allow experts to validate predictions against physical intuition. Energy efficiency and conservation are central concerns of the project. Lightweight architectures, active data selection, and model compression will be implemented to limit the computational footprint. Expected results include physical simulators enriched with new parameters, a significant reduction in experimental campaigns through targeted data acquisition, and the development of a robust and explainable AI framework. This thesis aims to exploit rich experimental and simulation data from the ANR MAMIENOVA and IMP3D, provided by LEM3 (Laboratory for the Study of Microstructures and Mechanics of Materials, Metz), in order to identify and characterize the latent parameters governing the plasticity of metallic materials, in an innovative machine learning context. The data includes high-resolution microscopic images (EBSD, ECCI), crystallographic maps, and stress fields from crystalline plasticity simulations [7]. Beyond materials, the proposed methodology is generic and transferable to many fields where data acquisition is costly and decision-making must take uncertainty into account. In particular, it could help reduce the societal and environmental costs associated with large-scale AI systems [8], or improve disease detection in costly multimodal contexts, such as EEGs, MRIs, or microbiological cultures, where active, explainable, and data-efficient learning strategies are particularly relevant [3].

Profil du candidat

Solide expérience en intelligence artificielle et apprentissage automatique, avec une expertise en Python, PyTorch/TensorFlow et en algorithmes avancés tels que les réseaux neuronaux et l'optimisation bayésienne. Capacité avérée à appliquer des techniques d'IA à des ensembles de données scientifiques complexes, pour la quantification de l'incertitude et les stratégies d'apprentissage actif. Excellentes compétences en rédaction scientifique, en expérimentation reproductible et en collaboration entre différents domaines. Titulaire d'un M2 en informatique, intelligence artificielle, science des données ou dans un domaine étroitement lié.

Candidate profile

Solid experience in artificial intelligence and machine learning, with expertise in Python, PyTorch/TensorFlow, and advanced algorithms such as neural networks and Bayesian optimization. Proven ability to apply AI techniques to complex scientific datasets for uncertainty quantification and active learning strategies. Excellent skills in scientific writing, reproducible experimentation, and cross-domain collaboration. Holder of a Master's degree in computer science, artificial intelligence, data science, or a closely related field.

Référence biblio

[1] Billy Perrigo. Exclusive: The $2 Per Hour Workers Who Made ChatGPT Safer. Jan. 2023. url: https: //time.com/6247678/openai-chatgpt-kenya-workers/ (visited on 02/23/2023).
[2] Eyke Hüllermeier and Willem Waegeman. “Aleatoric and Epistemic Uncertainty in Machine Learning: An
introduction to concepts and methods”. In: Machine Learning 110 (2021), pp. 457–506.
[3] Arthur Hoarau et al. Reducing Aleatoric and Epistemic Uncertainty through Multi-modal Data Acquisition. 2025. arXiv: 2501.18268 [cs.LG]. url: https://arxiv.org/abs/2501.18268.
[4] Burr Settles. Active Learning Literature Survey. Computer Sciences Technical Report 1648. University of Wisconsin–Madison, 2009.
[5] Arun Das and Paul Rad. Opportunities and Challenges in Explainable Artificial Intelligence (XAI): A Survey. 2020. arXiv: 2006.11371 [cs.CV]. url: https://arxiv.org/abs/2006.11371.
[6] Kristoffer K. Wickstrøm et al. “REPEAT: Improving Uncertainty Estimation in Representation Learning Explainability”. In: Proceedings of the AAAI Conference on Artificial Intelligence 39.8 (2025).
[7] Meriem Ben Haj Slama et al. “Electron channeling contrast imaging characterization and crystal plasticity modelling of dislocation activity in Ti21S BCC material”. In: Materialia 15 (2021), p. 100996.
[8] Arthur Hoarau et al. “Evidential uncertainty sampling strategies for active learning”. In: Machine Learning 113.9 (June 2024), pp. 6453–6474.