Offre de thèse
Développement de méthodes d'apprentissage automatique pour la prédiction de la viabilité et mortalité cellulaires en bioréacteurs.
Date limite de candidature
25-04-2025
Date de début de contrat
01-10-2025
Directeur de thèse
BASTOGNE Thierry
Encadrement
Pr Danièle Bensoussan (UTCT, CHU Nancy), co-directrice Pr Eric Olmos (LRGP), co-encadrant
Type de contrat
école doctorale
équipe
BioSIS : Biologie, Signaux et Systèmes en Cancérologie et Neurosciencescontexte
Bien que de nombreux essais cliniques soient en cours sur l'utilisation de Médicaments de Thérapies Innovantes (MTI), le principal défi auquel sont confrontés la majorité des investigateurs est la capacité de produire un grand nombre de cellules fonctionnelles dans un délai court et à un coût maîtrisé en raison essentiellement d'une variabilité non contrôlée des conditions initiales de culture. L'ambition de standardisation des lots de bioproduction repose sur la résolution de problèmes d'optimisation des conditions de culture et sur l'ajustement en temps réel des paramètres critiques des bioprocédés de fabrication. Mais ces deux enjeux requièrent de disposer de modèles fiables du comportement dynamique de la quantité et de la mortalité cellulaires. Lors de cultures en bioréacteurs, l'apparition des phénomènes de mort cellulaire reste très peu maîtrisée. En effet, lorsque l'un des substrats nécessaires à la croissance devient limitant, des mécanismes intracellulaires complexes de mort cellulaire sont enclenchés, notamment de mort programmée par apoptose. De manière générale, ces mécanismes sont irréversibles, ce qui implique qu'une action de régulation de la quantité de substrat a posteriori devient alors sans action sur la survie des cellules, ce qui impacte négativement les performances du bioprocédé. Pour améliorer les stratégies de contrôle du bioréacteur des modèles cinétiques de croissance et de mort cellulaire ont été largement documentés dans la littérature mais ceux-ci restent paramétrés lors de cultures définies et sont donc moyennement généralisables à d'autres conditions de culture et, a fortiori, à d'autres lignées cellulaires. L'utilisation de modèles métaboliques est également peu adaptée du fait de la complexité des mécanismes intracellulaires impliquées. Ainsi, il est attendu un gain significatif de performances en cas d'utilisation de modèles prédictifs de contrôle intégrant des modèles de mort cellulaire étendus (Dewasme et al., 2023).spécialité
Automatique, Traitement du signal et des images, Génie informatiquelaboratoire
CRAN - Centre de Recherche en Automatique de Nancy
Mots clés
Modèles hiérarchiques, Apprentissage statistique, Capteur logiciel, Plans d'expériences, Mortalité cellulaire, Bioproduction
Détail de l'offre
Le sujet de thèse concernera le développement de méthodes et d'outils pour l'identification de modèles dynamiques associés à deux variables de sortie : quantité et mortalité cellulaires. Il se décompose en deux axes complémentaires, partageant les mêmes jeux de données et utilisant le même type de modèle hiérarchique composé d'un modèle de premier principe biologique (modèle externe) et d'un modèle d'apprentissage de type réseau de neurones bayésien (modèle interne). Ce sujet s'inscrit dans le cadre d'une demande de projet CNRS MITI Avancées thérapeutiques (en cours de soumission) sur le financement de technologies de mesure complémentaires pour enrichir les bases de données à l'origine de la construction de nos modèles d'apprentissage. Les travaux de cette thèse seront notamment appliqués à la production de cellules eMDSC CD34+ dans le cadre du développement d'une nouvelle thérapie cellulaire.
Axe 1 : plans d'expériences intensifiés. L'optimisation de la densité cellulaire produite est actuellement réalisée via l'application de méthodes de planification statistique d'expériences. Leur principe est de sélectionner un nombre parcimonieux d'essais à réaliser pour identifier au mieux des modèles algébriques qui permettront notamment de prédire des points de fonctionnement pertinents. Un plan d'expériences comprend en moyenne entre 10 et 20 essais différents à réaliser. Dans le cas d'un bioréacteur, une session de culture peut durer entre 2 et 4 semaines selon le mode de production. Une campagne d'expérimentation fondée sur un tel plan peut donc durer au minimum 20 semaines. Cette durée constitue le principal obstacle qui freine leur mise en œuvre dans le secteur de la bioproduction. Notre objectif est de développer une alternative s'inspirant des travaux de Bayer et al. (Bayer et al., 2020; Nold et al., 2022) proposant un couplage hybride entre un réseau de neurones artificiel et un modèle de premiers principes biologiques qui leur permet de réaliser plusieurs conditions expérimentales différentes pendant une même session de production et ainsi de diviser au moins par trois la durée d'une campagne d'essais. Dans le prolongement de ce travail, nous souhaitons explorer l'usage d'autres techniques d'apprentissage comme celui de réseaux de neurones bayésiens sur lesquels nous travaillons déjà pour des applications médicales en radiothérapie.
Axe 2 : capteur logiciel de mortalité cellulaire. Ce second objectif est complémentaire à celui de l'axe 1 par la nature de la variable à modéliser et la réutilisation des données obtenues durant cette première phase. Il n'existe actuellement pas de technologie fiable pour mesurer et caractériser en temps réel la mortalité cellulaire pendant un cycle de bioproduction. Or cette connaissance impacte grandement la qualité des lots produits et permettrait d'ajuster au mieux les paramètres critiques du procédé pour maîtriser aussi bien la quantité (axe 1) que la viabilité (axe 2) des cellules. Le développement de capteurs logiciels dédiés aux bioréacteurs a fait l'objet d'un regain d'intérêt ces dernières avec l'intégration des nouvelles technologies analytiques (Gustavsson, 2018), (Pérez et al., 2020), (Reyes et al., 2022) comme les spectrométries Raman et proche infra-rouge. Dans ce sujet, nous souhaitons utiliser des capteurs plus répandus et moins coûteux comme les sondes diélectriques et de turbidité pour augmenter la portée des résultats. Nous compléterons ces données d'apprentissage par des mesures et caractérisations de la mortalité cellulaire issues de prélèvements quotidiens. Nous considèrerons les travaux de Kroll et al. (Kroll et al., 2017) comme base de départ et nous chercherons à améliorer la précision et la robustesse des résultats en identifiant un modèle dynamique hybride de la mortalité cellulaire dont la structure hiérarchique sera inspirée de celle (réseaux de neurones bayésiens couplés à un modèle de premiers principes) déjà investiguée dans l'axe 1.
Keywords
Hierarchical Models, Statistical Learning, Soft Sensor, Design of Experiments, Cell Mortality, Cell Production
Subject details
The PhD subject will focus on the development of methods and tools for identifying dynamic models associated with two output variables: cell quantity and cell mortality. It is structured around two complementary research axes, both utilizing the same datasets. The two application axes will rely on the same hierarchical model, consisting of (1) an external first-principles biological model, and (2) an internal learning model based on Bayesian neural networks. This research is part of the Bioproduction France 2030 initiative, aiming to develop a new measurement technology, as well as a proposed CNRS MITI Avancées Thérapeutiques project (currently under submission) that seeks funding for complementary measurement technologies to enhance the datasets used for training our learning models. The PhD work will be specifically applied to the production of CD34+ eMDSC cells, contributing to the development of a new cell therapy. Axis 1: Intensified Experimental Designs. The optimization of produced cell density is currently performed using statistical design of experiments (DoE) methods. These methods aim to select a minimal yet efficient number of trials to identify algebraic models that can predict optimal operating conditions. A typical design of experiments includes 10 to 20 different trials. In the case of a bioreactor, a single culture session can last between 2 and 4 weeks, depending on the production mode. This means that a full experimental campaign based on such a design can take at least 20 weeks, which is a major constraint limiting its implementation in bioproduction. Our goal is to develop an alternative inspired by Bayer et al. (Bayer et al., 2020; Nold et al., 2022), which proposes a hybrid approach combining an artificial neural network and a first-principles biological model. This approach enables multiple experimental conditions to be tested within a single production session, reducing the overall duration of a testing campaign by at least a factor of three. Building on this work, we also aim to explore the use of Bayesian neural networks, which we are already applying in the field of medical radiotherapy. Axis 2: Software Sensor for Cell Mortality. This second objective complements Axis 1 by focusing on a different variable to model—cell mortality—while also reusing the data collected during the first phase. Currently, there is no reliable technology to measure and characterize cell mortality in real-time during a bioproduction cycle. However, understanding cell mortality is crucial, as it significantly impacts the quality of production batches and enables optimal adjustment of critical process parameters, ensuring control over both cell quantity (Axis 1) and viability (Axis 2). The development of software sensors for bioreactors has gained renewed interest in recent years, thanks to the integration of new analytical technologies such as Raman and near-infrared spectrometry (Gustavsson, 2018; Pérez et al., 2020; Reyes et al., 2022). For this study, we aim to utilize more widely available and cost-effective sensors, such as dielectric and turbidity probes, to broaden the applicability of our results. Additionally, we will supplement the learning dataset with daily cell mortality measurements and characterizations from manual sampling. Our work will be based on the research by Kroll et al. (Kroll et al., 2017) as a starting point, and we will seek to enhance the accuracy and robustness of the results by developing a hybrid dynamic model of cell mortality. The hierarchical model structure will be inspired by the approach explored in Axis 1, combining Bayesian neural networks with a first-principles biological model.
Profil du candidat
Candiate(e) avec un double diplôme (M2) sciences du numérique / sciences de la vie.
Candidate profile
The candidate profile should have a dual expertise in digital sciences and biology, with at least a Master's level qualification
Référence biblio
Bayer, B., Striedner, G., Duerkop, M., 2020. Hybrid modeling and intensified DoE: an approach to accelerate upstream process characterization. Biotechnology journal 15, 2000121.
Dewasme, L., Mäkinen, M., Chotteau, V., 2023. Practical data-driven modeling and robust predictive control of mammalian cell fed-batch process. Computers & Chemical Engineering 171, 108164. https://doi.org/10.1016/j.compchemeng.2023.108164
Gustavsson, R., 2018. Development of soft sensors for monitoring and control of bioprocesses. Linköping University Electronic Press.
Kroll, P., Stelzer, I.V., Herwig, C., 2017. Soft sensor for monitoring biomass subpopulations in mammalian cell culture processes. Biotechnol Lett 39, 1667–1673. https://doi.org/10.1007/s10529-017-2408-0
Nold, V., Junghans, L., Bisgen, L., Drerup, R., Presser, B., Gorr, I., Schwab, T., Knapp, B., Wieschalka, S., 2022. Applying intensified design of experiments to mammalian cell culture processes. Eng Life Sci 22, 784–795. https://doi.org/10.1002/elsc.202100123
Pérez, P.A.L., López, R.A., Femat, R., 2020. Control in Bioprocessing: Modeling, Estimation and the Use of Soft Sensors. John Wiley & Sons.
Reyes, S.J., Durocher, Y., Pham, P.L., Henry, O., 2022. Modern Sensor Tools and Techniques for Monitoring, Controlling, and Improving Cell Culture Processes. Processes 10, 189. https://doi.org/10.3390/pr10020189