Offre de thèse
ENACT Modèles d'apprentissage profond géométriques pour étudier les protéines intrinsèquement désordonnées
Date limite de candidature
30-04-2025
Date de début de contrat
01-10-2025
Directeur de thèse
KHAKZAD Hamed
Encadrement
CSI annuel Réunion mensuelle avec l'équipe projet
Type de contrat
école doctorale
équipe
contexte
Développer de nouvelles méthodes d'apprentissage profond géométrique pour étudier et extraire des caractéristiques importantes des protéines désordonnéesspécialité
Informatiquelaboratoire
LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Mots clés
Apprentissage profond géométrique, Protéines désordonnées
Détail de l'offre
Ce poste de doctorat s'inscrit dans le cadre du projet IDPFold (2025-2029), récemment financé par l'Agence nationale de la recherche (ANR). L'objectif principal est de développer des modèles géométriques d'apprentissage profond pour l'étude des protéines intrinsèquement désordonnées (IDP). Le/la doctorant(e) sera encadré(e) par Hamed Khakzad (professeur junior, Inria). Notre équipe est composée de deux chercheurs permanents et de plusieurs doctorants et postdoctorants, et devrait s'agrandir grâce au recrutement de nouveaux membres. Notre objectif principal est de développer des modèles d'apprentissage profond pour étudier et prédire la structure, les interactions et la fonction des protéines, et de concevoir des molécules synthétiques. L'équipe a accès à des ressources de calcul, notamment des GPU et des CPU performants, provenant de différents pôles de recherche, dont Grid5000, Jean Zay, etc.
Les IDP constituent un vaste sous-ensemble de protéines dépourvues de structure 3D stable à l'isolement. Elles sont impliquées dans divers processus cellulaires et dans les interactions protéine-protéine (IPP). L'un des aspects clés des IDP est leur capacité à passer du désordre à l'ordre lors de leur liaison à une structure cible. Bien que la compréhension de ce mécanisme soit essentielle, elle reste un problème ouvert dans le domaine. De nouvelles approches basées sur l'apprentissage profond ont permis des avancées remarquables dans la structure des protéines et la prédiction complexe. Cependant, les performances de ces méthodes pour la prédiction des IPP impliquant des IDP sont encore insuffisantes, principalement en raison de la complexité imposée par les régions flexibles. Ce poste de doctorat vise à développer des modèles géométriques d'apprentissage profond pour élucider ce mécanisme complexe et s'appuiera potentiellement sur les travaux de recherche en cours au sein de l'équipe [ref]. Le/la doctorant(e) aura la possibilité de participer à des collaborations internationales et travaillera en étroite collaboration avec les chercheurs permanents du laboratoire sur ce sujet.
Keywords
Geometric deep learning, Disordered proteins
Subject details
This PhD position is part of the IDPFold project (2025-2029) recently funded by the French National Research Agency (ANR). The main goal is to develop geometric deep learning models to study intrinsically disordered proteins (IDP). The PhD candidate will be supervised by Hamed Khakzad (Junior Professor, Inria). Our team consists of two permanent researchers with several PhD and postdoc members, and is expected to grow by hiring new members. Our main goal is to develop deep learning models, to study, and predict protein structure, interactions, function and to further design synthetic molecules. The team has access to computational resources, including efficient GPUs and CPUs, from different cluster centers including Grid5000, Jean Zay, etc. IDPs are a large subset of proteins with no stable 3D structure on isolation. They are involved in various cellular processes, and protein-protein interactions (PPIs). One of the key aspects of IDPs is their ability to undergo disorder-to-order transition upon binding to a target structure. While understanding this mechanism is essential, it remains an open problem in the field. Novel approaches based on deep learning have started to make remarkable advances in protein structure and complex prediction. However, the performance of these methods on PPI prediction where IDPs are involved is still lagging behind, mostly due to the complexity imposed by flexible regions. This PhD position aims to develop geometric deep learning models to elucidate this complex mechanism and will be potentially built on on-going research efforts in the team [ref]. The PhD candidate will have the possibility to be involved in international collaborations and will work closely with permanent researchers of the lab on this topic.
Profil du candidat
• Master en informatique ou bioinformatique
• Maîtrise de Python et bonnes pratiques de codage obligatoires
• Expérience en apprentissage profond (PyTorch) obligatoire
• Connaissances en biochimie des protéines
• Capacité à travailler de manière autonome et en équipe
• Excellente maîtrise de l'anglais à l'oral et à l'écrit
Candidate profile
• Master degree in Computer Science, or Bioinformatics
• Proficiency in Python and good coding practices is mandatory
• Experience in deep learning (PyTorch) is mandatory
• Knowledge in protein biochemistry
• Ability to work independently and also to work in a team
• Excellent oral and written English skills
Référence biblio
[ref] Mokhtari, O. et al. 'DynamicGT: a dynamic-aware geometric transformer model to predict protein binding interfaces in flexible and disordered regions', bioRxiv, 2025.