CD - PREDICTION DE L'ASSEMBLAGE MOLECULAIRE DANS DES FORMES CRISTALLINES DES PRINCIPES ACTIFS PHARMACEUTIQUES (APIs) A PARTIR DE MODELES D'IA - MACHINE LEARNING

Offre de thèse

CD - PREDICTION DE L'ASSEMBLAGE MOLECULAIRE DANS DES FORMES CRISTALLINES DES PRINCIPES ACTIFS PHARMACEUTIQUES (APIs) A PARTIR DE MODELES D'IA - MACHINE LEARNING

Date limite de candidature

07-09-2026

Date de début de contrat

01-10-2026

Directeur de thèse

ESPINOSA Enrique

Encadrement

L'encadrement de cette thèse interdisciplinaire sera réalisé au sein du laboratoire CRM2 (Pr. Enirique Espinosa et Dr. Emmanuel Aubert) et en collaboration étroite avec le laboratoire LORIA (Pr. Sabeur Aridhi).

Type de contrat

Concours pour un contrat doctoral

école doctorale

C2MP - CHIMIE MECANIQUE MATERIAUX PHYSIQUE

équipe

Equipe Claude DIDIERJEAN

contexte

Voir résumé

spécialité

Sciences des Matériaux

laboratoire

CRM2 - Cristallographie, Résonance Magnétique et Modélisations

Mots clés

IA - Machine Learning models, Principeas actifs pharmaceutiques (APIs), Assemblage moléculaire, Interactions intermoléculaires, Descripteurs électroniques moléculaires

Détail de l'offre

Au cours des dernières années, l'intelligence artificielle (IA) et le Machine Learning se sont imposés comme des outils majeurs pour l'exploration de l'espace chimique et la prédiction de propriétés moléculaires complexes. En établissant des relations non linéaires entre structure, propriétés électroniques et interactions intermoléculaires, ces approches ouvrent des perspectives nouvelles pour modéliser des phénomènes difficiles à traiter par des méthodes purement expérimentales ou théoriques, en particulier lorsqu'il s'agit de prédire l'autoassemblage et l'organisation tridimensionnelle des molécules à l'état solide.
Les formes galéniques des ingrédients pharmaceutiques actifs (Active Pharmaceutical Ingredients, API) sont souvent solides puisqu'elles sont chimiquement stables et faciles à administrer et à produire. Les médicaments sous forme solide peuvent exister soit à l'état cristallin soit à l'état amorphe, avec une préférence pour le premier vu l'instabilité de nombreux matériaux amorphes. Un API peut être cristallisé seul, en tant qu'un composant unique, ou avec d'autres molécules pour former des cristaux à plusieurs composants, tels que des hydrates, des solvates, des sels ou des co-cristaux. Pour chacune de ces phases, les divers cristaux d'un même API possèdent des propriétés physico-chimiques différentes de celles des autres formes, ce qui peut affecter la stabilité et la biodisponibilité du médicament. Une telle diversité offre la possibilité de contrôler les propriétés physico-chimiques de l'API en conservant l'activité thérapeutique du principe actif. Le solide cristallin d'un API, qu'il soit formé par un ou plusieurs composants, peut présenter plusieurs formes qui sont associées au phénomène du polymorphisme. Les différentes formes polymorphiques possèdent aussi différentes propriétés physico-chimiques, puisqu'elles sont dépendantes de la structure à l'état solide, laquelle varie selon le polymorphe formé. L'un des aspects les plus importants des diverses formes cristallines des APIs et de leurs polymorphes concerne le fait qu'ils peuvent améliorer les propriétés du principe actif sans changer son activité biologique intrinsèque.
Objectifs de la thèse :
La reconnaissance moléculaire, puis l'autoassemblage entre les molécules formant le cristal, se fait via des interactions intermoléculaires. Cependant, malgré l'utilisation des règles phénoménologiques guidant la synthèse supramoléculaire de phases crystallines, leur formation 3D ne peut pas être prédite. Par ailleurs, les éventuelles formes polymorphiques d'un assemblage cristallin sont très difficiles à identifier à partir de calculs d'énergie.
Dans ce contexte, et à l'aide de méthodes IA - Machine Learning, les objectifs de ce projet de thèse de doctorat sont :
• Apprendre des représentations moléculaires informatives à partir de données quantiques (charges atomiques, descripteurs électroniques, énergies), permettant de décrire finement les interactions intermoléculaires
• Prédire les propriétés moléculaires qui décrivent les interactions intermoléculaires
• Prédire l'assemblage moléculaire 3D d'un principe actif (API) (formes cristallines et polymorphes) en utilisant les descripteurs moléculaires obtenus précédemment
Déroulé du projet doctoral :
Ce projet scientifique présente un fort caractère innovateur de par sa méthodologie avec l'utilisation de modèles d'IA-Machine Learning pour la prédiction des assemblages moléculaires, en particulier des APIs. De ce fait, des compétences dans le domaine de l'IA – Machine Learning sont un prérequis important pour candidater, alors que les compétences en calculs de chimie quantique et en modélisation moléculaire pourront être acquises pendant le déroulement des travaux de thèse. Le développement informatique et des modèles d'IA pour la prédiction des assemblages moléculaires sera réalisé en collaboration avec le Pr. Sabeur Aridhi (LORIA).

Keywords

IA - Machine Learning models, Active Pharmaceutical Ingredients (APIs), Molecular assembly, Intermolecular interactions, Molecular electronic descriptors

Subject details

In recent years, artificial intelligence (AI) and machine learning have emerged as key tools for exploring chemical space and predicting complex molecular properties. By establishing non-linear relationships between structure, electronic properties, and intermolecular interactions, these approaches open new perspectives for modelling phenomena that are difficult to address using purely experimental or theoretical methods, particularly when it comes to predicting the self-assembly and three-dimensional organization of molecules in the solid state. The dosage forms of active pharmaceutical ingredients (APIs) are often solid because they are chemically stable and easy to administer and produce. Drugs in solid form can exist in either a crystalline or amorphous state, with a preference for the former due to the instability of many amorphous materials. An API can be crystallized alone, as a single component, or with other molecules to form multi-component crystals, such as hydrates, solvates, salts, or co-crystals. For each of these phases, the various crystals of the same API possess different physical-chemical properties compared to other forms, which can affect the stability and bioavailability of the drug. This diversity offers the possibility of controlling the physical-chemical properties of the API while preserving the therapeutic activity of the active ingredient. The crystalline solid of an API, whether formed from one or more components, can exhibit several forms associated with the phenomenon of polymorphism. The different polymorphic forms also possess different physical-chemical properties, as these are dependent on the solid-state structure, which varies according to the polymorph formed. One of the most important aspects of the various crystalline forms of APIs and their polymorphs is their ability to enhance the properties of the active ingredient without altering its intrinsic biological activity. Thesis Objectives: Molecular recognition and subsequent self-assembly between the molecules forming the crystal occur via intermolecular interactions. However, despite the application of phenomenological rules governing the supramolecular synthesis of crystalline phases, their 3D formation cannot be predicted. Furthermore, the potential polymorphic forms of a crystalline assembly are very difficult to identify using energy calculations. In this context, and using AI – Machine Learning methods, the objectives of this doctoral thesis project are: • To learn informative molecular representations from quantum data (atomic charges, electronic descriptors, energies), enabling a detailed description of intermolecular interactions • To predict the molecular properties that describe intermolecular interactions • To predict the 3D molecular assembly of an active pharmaceutical ingredient (API) (crystalline and polymorphic forms) using the previously obtained molecular descriptors Doctoral Project Outline: This scientific project is highly innovative due to its methodology, which uses AI – Machine Learning models to predict molecular assemblies, particularly APIs. Therefore, skills in AI – Machine Learning are an important prerequisite for application, while skills in quantum chemistry calculations and molecular modelling can be acquired during the course of the thesis work. The development of computer science and AI models for predicting molecular assemblies will be carried out in collaboration with Professor Sabeur Aridhi (Artificial Intelligence and Big data team, LORIA – TELECOM Nancy).

Profil du candidat

Ce projet scientifique présente un fort caractère innovateur de par sa méthodologie avec l'utilisation de modèles d'IA-Machine Learning pour la prédiction des assemblages moléculaires, en particulier des APIs. De ce fait, des compétences dans le domaine de l'IA – Machine Learning sont un prérequis important pour candidater, alors que les compétences en calculs de chimie quantique et en modélisation moléculaire pourront être acquises pendant le déroulement des travaux de thèse.

Candidate profile

This scientific project is highly innovative due to its methodology, which uses AI – Machine Learning models to predict molecular assemblies, particularly APIs. Therefore, skills in AI – Machine Learning are an important prerequisite for application, while skills in quantum chemistry calculations and molecular modelling can be acquired during the course of the thesis work.

Référence biblio

1 Hilfiker, R. (2006). Polymorphism: In the Pharmaceutical Industry. Wiley-VCH, Germany.
2 Vippagunta, S. R., Brittain, H. G. & Grant, D. J. W. (2001). Adv. Drug Delivery Rev., 48, 3-26.
3 Shan, N. & Zaworotko, M.J. (2008). Drug Discov. Today. 13, 440–446.
4 Byrn, S. R., Pfeiffer, R., Stephenson, G. A., Grant, D. J. W. & Gleason, W. (1994). Chem. Mater. 6, 1148-1158.
5 Byrn, S. R., Pfeiffer, R. R., Ganey, M., Hoiberg, C. & Poochikian, G. (1995). Pharmaceut. Res. 12, 945-954.
6 Aakeroy, C. B. & Salmon, D. J. (2005). CrystEngComm.7, 439–448.
7 Aakeroy, C. B. (1997). Acta Cryst. B53, 569–586.
8 Steed, J. W. (2013). Trends Pharmacol. Sci. 34, 185–193.
9 Blagden, N., Berry, D. J., Parkin, A., Javed, H., Ibrahim, A., Gavan, P. T., De Matos, L. L. & Seaton, C. C. (2008). New J. Chem. 32, 1659–1672
10 Qiao, N., Li, M.,Schlindwein, W., Malek, N., Davies, A., Trappitt, G. (2011). Int. J. Pharm. 419, 1–11.
11 Lu, J. & Rohani, S. (2009). Org. Process Res. Dev. 13, 1269–1275.
12 Etter, M. C. (1991). J. Phys. Chem. 95, 4601–4610.
13 Vishweshwar, P., McMahon, J. A., Bis, J. A. & Zaworotko, M. J. (2006). J. Pharm. Sci. 95, 499–516.
14 Brittain, H.G. & Grant, D.J.W. (1999). Effect of polymorphism and solid- state solvation on solubility and dissolution rate, in: H.G. Brittain (Ed.), Polymorphism in Pharmaceutical Solids. Marcel Dekker, New York.
15 Giron. D. (1995). Thermochim. Acta. 248, l-59.
16 Threlfall, T. L. (1995). Analyst. 120, 2435-2460.
17 Gavezzotti, A. & Filippini. G. (1995). J. Am. Chem. Soc. 117, 12299-12305.
18 Gavezzotti, A. (2007). Molecular Aggregation. Oxford University Press, New York.
19 Bader, R. F. W. (1990). Atoms in Molecules − A Quantum Theory. Clarendon: Oxford, U.K.
20 Autef, L., Aubert, E., Aridhi, S. & Espinosa, E. (2026). CrystEngComm (manuscrit soumis pour publication).