ENACT - MODELISATION DE SYSTEMES LUMINESCENTS PAR DYNAMIQUE MOLECULAIRE BASEE SUR LE MACHINE LEARNING

Offre de thèse

ENACT - MODELISATION DE SYSTEMES LUMINESCENTS PAR DYNAMIQUE MOLECULAIRE BASEE SUR LE MACHINE LEARNING

Date limite de candidature

15-05-2026

Date de début de contrat

01-10-2026

Directeur de thèse

PONCE VARGAS Miguel

Encadrement

L'encadrement scientifique du doctorant sera assuré par Miguel Ponce Vargas, directeur de thèse, et Michael Badawi, co-directeur de thèse. Des réunions de suivi seront organisées de manière hebdomadaire afin d'assurer un encadrement régulier et de discuter de l'avancement des travaux de recherche. L'évaluation des résultats reposera notamment sur la comparaison avec des données expérimentales disponibles ainsi qu'avec des calculs de référence réalisés à l'aide de méthodes de théorie de la fonctionnelle de la densité (DFT) à un niveau de théorie élevé. Par ailleurs, le doctorant suivra des formations complémentaires dans le domaine de l'intelligence artificielle, avec un accent particulier sur les méthodes à noyaux (kernel methods), afin de soutenir le développement méthodologique du projet et d'enrichir les compétences transversales nécessaires à la conduite des travaux de recherche.

Type de contrat

Programmes ministériels spécifiques

école doctorale

C2MP - CHIMIE MECANIQUE MATERIAUX PHYSIQUE

équipe

InterAct

contexte

Aujourd'hui, la recherche de nouvelles sondes luminescentes constitue un domaine en pleine expansion, stimulé par leurs nombreuses applications en imagerie biologique, en diagnostic médical et en biodétection[1,11]. En particulier, le développement de sondes émettant dans le rouge et le proche infrarouge permet une meilleure pénétration dans les tissus biologiques, tout en réduisant les dommages photo-induits ainsi que l'autofluorescence des milieux biologiques[2]. Du point de vue théorique, la modélisation quantique joue un rôle essentiel dans la compréhension et la prédiction des propriétés optiques de ces systèmes. La TD-DFT (Time-Dependent Density Functional Theory) est largement utilisée pour étudier les propriétés d'absorption et d'émission et pour établir des relations structure–propriétés. Cependant, cette méthode présente des limitations importantes : l'étude de systèmes de grande taille entraîne un coût computationnel très élevé, limitant son application aux molécules ou complexes relativement petits. De plus, la TD-DFT rencontre d'autres limitations notables, notamment en ce qui concerne la description explicite du solvant et la prise en compte des effets de température, deux facteurs clés qui influencent la conformation moléculaire[3–6]. De plus, les configurations conformationnelles de l'état excité, décisives pour les propriétés optiques, ne sont pas correctement décrites par les champs de force conventionnels utilisés en dynamique moléculaire classique, ce qui limite l'exactitude des simulations lorsqu'un échantillonnage conformationnel réaliste de systèmes complexes est requis[6]. Une approche alternative prometteuse consiste à intégrer explicitement l'environnement dynamique par le biais de la dynamique moléculaire ; toutefois, cette stratégie nécessite des champs de force capables d'atteindre une précision comparable à celle des méthodes ab initio. Récemment, l'essor des champs de force basés sur le machine learning (ML) a démontré leur capacité à combiner une précision de niveau quantique avec une efficacité adaptée aux simulations à grande échelle[5–8]. Ces approches incluent le développement de champs de force précis et transférables[5–7], l'incorporation de degrés électroniques et d'effets non locaux [8], ainsi que leur application à la prédiction et à la conception de systèmes fluorescents complexes[3,9–12].

spécialité

Chimie

laboratoire

L2CM - Laboratoire Lorraine de Chimie Moléculaire

Mots clés

Dynamique moléculaire, Systèmes luminescentes, Apprentissage automatique, Champs de force, TD-DFT, Imagerie médicale

Détail de l'offre

La recherche de nouvelles sondes luminescentes constitue un domaine en plein essor en raison de leurs nombreuses applications en imagerie biologique, en diagnostic médical et en biodétection. En particulier, les sondes émettant dans le rouge et le proche infrarouge présentent un intérêt majeur, car elles permettent une meilleure pénétration dans les tissus biologiques tout en limitant l'autofluorescence et les dommages photo-induits.
Sur le plan théorique, la modélisation quantique joue un rôle essentiel pour comprendre et prédire les propriétés optiques de ces systèmes. La TD-DFT est largement utilisée pour étudier les processus d'absorption et d'émission et établir des relations structure–propriétés. Cependant, cette approche présente plusieurs limitations : son coût computationnel devient très élevé pour les systèmes de grande taille et elle décrit difficilement certains effets essentiels, tels que l'influence explicite du solvant ou les effets de température, qui peuvent modifier les conformations moléculaires et donc les propriétés optiques.
Par ailleurs, les champs de force classiques utilisés en dynamique moléculaire ne décrivent pas correctement les états excités, ce qui limite leur capacité à reproduire la dynamique conformationnelle des chromophores luminescents. Les champs de force basés sur l'apprentissage automatique (machine learning, ML) représentent une alternative prometteuse, car ils permettent d'atteindre une précision proche des méthodes quantiques tout en conservant une efficacité compatible avec des simulations de grande échelle.
Dans ce projet, nous proposons d'étudier le comportement de molécules luminescentes en milieux aqueux et organiques en combinant dynamique moléculaire et approches de ML. L'objectif est de développer des champs de force fiables et transférables capables de reproduire les surfaces d'énergie potentielle obtenues par des calculs TD-DFT de haut niveau, tout en permettant l'exploration efficace de la flexibilité conformationnelle des chromophores et des effets du solvant.
Dans une première étape, nous utiliserons une base de données de fluorophores synthétisés par Jean-Bernard Regnouf (équipe SAMPA, L2CM), en particulier des molécules basées sur le motif 2,2′-bithiazole et des systèmes supramoléculaires flexibles tels que les podands 2,2′-bithiazolyl-p-tert-butylcalix[4]arène (voir la Figure 1). Les données expérimentales d'absorption et d'émission disponibles permettront de valider les calculs TD-DFT utilisés pour entraîner les modèles ML.
Les champs de force développés seront ensuite appliqués à un ensemble plus large de chromophores afin d'évaluer leur transférabilité et d'étudier l'influence de l'environnement sur les propriétés optiques. Cette approche permettra d'identifier les motifs structuraux contrôlant l'absorption, l'émission et la rigidité conformationnelle des molécules.
À terme, ce projet vise à établir une méthodologie prédictive combinant données expérimentales, calculs TD-DFT et apprentissage automatique pour la conception rationnelle de nouvelles sondes luminescentes. Il contribuera également à renforcer l'expertise du laboratoire L2CM dans le domaine de l'intelligence artificielle appliquée à la chimie moléculaire et aux systèmes luminescents.

Keywords

Molecular Dynamics, Luminescent Systems, Machine Learning, Force Fields, TD-DFT, Medical Imaging

Subject details

The development of new luminescent probes is a rapidly growing research area due to their wide range of applications in biological imaging, medical diagnostics, and biosensing. In particular, probes emitting in the red and near-infrared regions are especially attractive because they allow deeper penetration into biological tissues while reducing autofluorescence and photodamage. From a theoretical perspective, quantum chemical modeling plays a crucial role in understanding and predicting the optical properties of these systems. Time-Dependent Density Functional Theory (TD-DFT) is widely used to investigate absorption and emission processes and to establish structure–property relationships. However, this approach presents significant limitations. Its computational cost becomes prohibitive for large systems, and it often struggles to accurately account for key factors such as explicit solvent effects and temperature, both of which strongly influence molecular conformations and optical properties. In addition, conventional force fields used in classical molecular dynamics simulations are not designed to accurately describe excited states, which limits their ability to capture the conformational dynamics relevant to luminescent chromophores. In this context, machine-learning (ML)–based force fields represent a promising alternative, as they can achieve near-quantum accuracy while retaining the computational efficiency required for large-scale simulations. In this project, we propose to investigate the behavior of luminescent molecules in aqueous and organic environments by combining molecular dynamics simulations with machine-learning approaches. The goal is to develop reliable and transferable force fields capable of reproducing potential energy surfaces obtained from high-level TD-DFT calculations while enabling efficient sampling of chromophore conformational flexibility and solvent effects. The first stage will rely on a database of fluorophores synthesized by Jean-Bernard Regnouf (SAMPA team, L2CM), including molecules based on the 2,2′-bithiazole motif and flexible supramolecular systems such as 2,2′-bithiazolyl-p-tert-butylcalix[4]arene podands (See Figure 1). The availability of consistent experimental absorption and emission data provides a valuable benchmark to validate the TD-DFT calculations used to train the ML models. The resulting force fields will then be applied to a broader range of chromophores in order to assess their transferability and to investigate how environmental factors influence optical properties. This approach will help identify key structural features governing absorption, emission, and conformational rigidity. Ultimately, this project aims to establish a predictive framework combining experimental data, TD-DFT calculations, and machine learning for the rational design of improved luminescent probes. It will also strengthen the expertise of the L2CM laboratory in the application of artificial intelligence to molecular chemistry and luminescent systems.

Profil du candidat

Le doctorant devra posséder un niveau Master en chimie, physique ou science des matériaux, avec une solide formation en chimie théorique et modélisation moléculaire. Des compétences en programmation (Python, C++, ou équivalent) et en machine learning sont fortement souhaitées. La maîtrise de logiciels de chimie quantique (notamment Gaussian) et une bonne compréhension des méthodes TD-DFT sont un atout. Des qualités telles que rigueur scientifique, autonomie, esprit d'analyse et capacité à travailler en équipe internationale sont également recherchées. La connaissance de l'anglais scientifique est indispensable pour la lecture de la littérature et la diffusion des résultats.

Candidate profile

The PhD candidate should hold a Master's degree in chemistry, physics, or materials science, with a strong background in theoretical chemistry and molecular modeling. Skills in programming (Python, C++, or equivalent) and machine learning are highly desirable. Proficiency in quantum chemistry software (notably Gaussian) and a good understanding of TD-DFT methods are considered an asset. Personal qualities such as scientific rigor, autonomy, analytical thinking, and the ability to work in an international team are also sought. A good command of scientific English is essential for reading the literature and disseminating results.

Référence biblio

[1] Unke, O. T.; Chmiela, S.; Sauceda, H. E.; Gastegger, M.; Poltavsky, I.; Schütt, K. T.; Tkatchenko, A.; Müller, K.-R. Machine learning force fields. Chemical Reviews 2021, 121, 10142–10186.
[2] Fu, J.; Zhang, S.; Zheng, X. Recent progress of machine learning on organic optoelectronic materials: absorption/emission predictions. Computational Intelligence in Chemistry Characterization (CICC) 2025, 7 (3), 181–189.
[3] Wang, L.; et al. High-precision prediction of fluorescence wavelength of organic compounds based on ensemble automatic machine learning method and online querying. Dyes and Pigments 2025, 242, 113012.
[4] Ju, C. W.; Bai, H.; Li, B.; Liu, R. Machine learning enables highly accurate predictions of photophysical properties of organic fluorescent materials: emission wavelengths and quantum yields. Journal of Chemical Information and Modeling 2020, 60, 1053–1065.
[5] Predicting fluorescence emission wavelengths and quantum yields via machine learning. Scientific Reports 2025, 15, 12345–12358.
[6] Enhanced prediction of absorption and emission wavelengths of organic compounds through hybrid graph neural network architectures. Journal of Chemical Physics 2025, 152, 074110–074124.
[7] Prediction and exploration of emission wavelength (or energy) of luminescent materials based on machine learning. Journal of Luminescence 2025, 279, 121024.
[8] Data-driven machine learning models for predicting the maximum absorption and emission wavelengths of single benzene fluorophores. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy 2025, 326, 125213.
[9] Lehn, J.-M.; Regnouf-de-Vains, J.-B. Synthesis of macrobicyclic cryptates incorporating bithiazole, biimidazole and bipyrimidine binding subunits. Tetrahedron Letters 1989, 30, 2209–2212.
[10] Lehn, J.-M.; Regnouf-de-Vains, J.-B. Synthesis and properties of macrobicyclic cryptates incorporating five- and six-membered biheteroaryl units. Helvetica Chimica Acta 1992, 75, 1221–1236.
[11] Echegoyen, L.; Perez-Cordero, E.; Regnouf-de-Vains, J.-B.; Roth, C.; Lehn, J.-M. Formation of cryptatium species in solution: electrochemistry of bipyridyl-, bipyrimidyl- and bithiazole-based cryptates. Inorganic Chemistry 1993, 32 (5), 572–579.
[12] Pellet-Rostaing, S.; Regnouf-de-Vains, J.-B.; Lamartine, R. 2,2′-Bithiazolyl-p-tert-butylcalix[4]arene podands: synthesis and fluorescence properties. Tetrahedron Letters 1996, 37 (33), 5889–5892.
[13] Pellet-Rostaing, S.; Regnouf-de-Vains, J.-B.; Lamartine, R.; Meallier, P.; Guittonneau, S.; Fenet, B. Fluorescence quenching of 2,2′-bithiazole-containing calix[4]arenes by copper(I). Helvetica Chimica Acta 1997, 80, 1229–1243.
[14] Pellet-Rostaing, S.; Regnouf-de-Vains, J.-B.; Lamartine, R.; Fenet, B. A bithiazole-containing calix[4]arene as a versatile ligand for copper(I) and copper(II). Inorganic Chemistry Communications 1999, 2 (2), 4–7.
[15] Wagner, M.; Engrand, P.; Regnouf-de-Vains, J.-B.; Marsura, A. Heptakis-6-(5-methylene-ureido-5′-methyl-2,2′-bithiazolyl)-cyclomaltoheptaose as a new fluorescent polydentate ligand. Tetrahedron Letters 2001, 42 (31), 5207–5209.
[16] Mourer, M.; Psychogios, N.; Laumond, G.; Aubertin, A.-M.; Regnouf-de-Vains, J.-B. Synthesis and anti-HIV evaluation of water-soluble calixarene-based bithiazolyl podands. Bioorganic & Medicinal Chemistry 2010, 18, 36–45.
[17] Geller, C.; Fontanay, S.; Mourer, M.; Massimba Dibama, H.; Regnouf-de-Vains, J.-B.; Finance, C.; Duval, R. E. Antiseptic properties of two calix[4]arene derivatives on the human coronavirus 229E. Antiviral Research 2010, 88, 343–346.
[18] Mourer, M.; Massimba Dibama, H.; Constant, P.; Daffé, M.; Regnouf-de-Vains, J.-B. Anti-mycobacterial activities of some cationic and anionic calix[4]arene derivatives. Bioorganic & Medicinal Chemistry 2012, 20, 2035–2041.
[19] Mourer, M.; Fontanay, S.; Duval, R. E.; Regnouf-de-Vains, J.-B. Synthesis, characterisation and biological evaluation as antibacterial agents of water-soluble calix[4]arenes and phenol derivatives incorporating carboxylate groups. Helvetica Chimica Acta 2012, 95 (8), 1373–1386.