Offre de thèse
ENACT Transport optimal pour la classification automatique et la modélisation de données spectroscopiques multimodales : application au diagnostic in vivo de cancers de la peau
Date limite de candidature
01-10-2025
Date de début de contrat
01-10-2025
Directeur de thèse
BLONDEL Walter
Encadrement
co-encadré par Paul CATALA Maître de conférence stagiaire au CRAN (recruté depuis le 01/09/2024)
Type de contrat
école doctorale
équipe
BioSIS : Biologie, Signaux et Systèmes en Cancérologie et Neurosciencescontexte
La thèse s'effectuera au sein du projet PhotoDiag du département BioSiS, au CRAN. L'équipe pluridisciplinaire du projet PhotoDiag rassemble des forces de recherches fondamentale et clinique dans trois domaines de compétences complémentaires, la santé, la biologie et le signal/instrumentation. Elle développe ses travaux dans ses champs d'expertise reconnue : le photodiagnostic et la photothérapie préclinique et clinique, la photobiologie et nanomédecine en cancérologie pour du théranostic et la spectro-imagerie optique in vivo. Le ou la candidat.e interagira également avec le projet SiMul du département BioSiS, dont l'expertise porte sur des outils méthodologiques pour le traitement de données multidimensionnelles.spécialité
Automatique, Traitement du signal et des images, Génie informatiquelaboratoire
CRAN - Centre de Recherche en Automatique de Nancy
Mots clés
Transport Optimal, Spectro-imagerie, Problèmes inverses, Multimodal, Cancer, Peau
Détail de l'offre
1. Contexte de recherche
Les procédures cliniques standard de diagnostic des cancers de la peau impliquent des examens visuels, suivis de biopsies chirurgicales, qui sont invasives et pas toujours précises [1]. En revanche, les méthodes de spectro-imagerie optique ont un potentiel pour la caractérisation non invasive des cancers. Leur intérêt réside dans leur sensibilité aux modifications de la peau lors des changements structurels au cours du développement des cancers. Dans ce contexte, le CRAN a développé le dispositif SpectroLive [2], dont l'essai clinique a permis de recueillir l'une des plus grandes bases de données de mesures in vivo de réflectance diffuse (RD) et d'autofluorescence (AF) résolues spatialement et spectralement [3].
Ce projet porte sur l'estimation inverse des propriétés optiques (PO) de la peau à partir de spectres AF et RD. L'identification des PO est cruciale car elle permet de déduire les causes des modifications observées, apportant de nouvelles connaissances sur les cancers de la peau. Ce problème mal posé est difficile à résoudre, car les caractéristiques cutanées présentent de fortes variations inter- et intra-individuelles. Cette hétérogénéité entrave les traitements automatiques et requiert des procédures de normalisation [4] qui n'améliorent pas toujours la précision de la classification [5]. Pour y remédier, la conception d'un score de similarité entre les données spectroscopiques robuste à cette variabilité joue un rôle central.
Le transport optimal (TO) permet de comparer des distributions sur des critères géométriques, contrairement aux métriques usuelles telles que la distance euclidienne. De manière informelle, le TO mesure l'effort nécessaire pour déplacer toute la masse d'une distribution sur l'autre. Des travaux récents ont montré que ce type de distance est plus pertinent lorsqu'il s'agit de comparer, par exemple, des spectres moléculaires [6]. Les TO non équilibré (TON) [7] seront particulièrement étudiées dans cette thèse.
2. Projet de recherche
Une idée clé de ce projet est que l'intégration du TO dans le traitement permettra de réduire la sensibilité des méthodes à la variabilité des spectres. L'objectif sera d'étudier l'utilisation du TON comme mesure de similarité entre les spectres lors de l'estimation inverse de PO. Plus précisément, nous considèrerons les trois défis suivants.
(A) Le TON permet de traiter des distributions avec des normalisations différentes. Ceci est pertinent dans notre contexte où les données in vivo souffrent de problèmes de normalisation. L'étalonnage des performances du TON pour le clustering de spectres AF ou DR sera le premier objectif de cette thèse.
(B) L'ajustement des modèles de Monte Carlo aux données spectroscopiques, afin d'estimer les PO des tissus cutanés, requiert des fonctions de perte adéquates sur les spectres. La deuxième partie de cette thèse consiste à étudier l'utilisation de distances TON comme termes d'attache aux données dans l'estimation inverse. Il s'agira notamment de trouver un compromis entre une reconstruction des PO fiable, et la calculabilité de l'algorithme. En particulier, nous aurons recours à des approximations numériques du TON, telles que la régularisation entropique [8] ou le TO tranché [9].
(C) Bien que les données spectroscopiques présentent une grande variabilité, il existe des corrélations entre les marqueurs OP de tissus similaires. Pour en tirer parti, nous étudierons l'utilisation des termes de couplage OT entre les OP de plusieurs échantillons lors de la résolution du problème inverse (une idée similaire a été envisagée dans [10] pour les données EEG/MEG). Ces marqueurs consistent en des vecteurs de coefficients (par exemple, diffusion, absorption) dépendant de la longueur d'onde, et peuvent être modélisés comme des distributions à valeurs vectorielles. Nous aurons donc recours à l'OT vectoriel pour effectuer ce couplage, en adaptant les approximations standard de l'OT à ce cadre vectoriel difficile.
Keywords
Optimal transport, Spectro-imaging, Inverse problem, Multimodal, Cancer, Peau
Subject details
1. Research context Standard clinical procedures for diagnosing skin cancers involve visual examinations, followed by surgical biopsies, which are invasive and not always accurate [1]. In contrast, optical spectro-imaging methods have potential for non-invasive characterisation of cancers. Their interest lies in their sensitivity to modifications of skin, along with structural changes during the development of cancers. In this context, CRAN has developed and patented the SpectroLive device [2], whose clinical trial collected one of the largest data base of spatially and spectrally resolved diffuse reflectance (DR) and autofluorescence (AF) in vivo measurements [3]. This proposal targets the inverse estimation of skin optical properties (OP) from AF and DR spectra. Identifying OP crucially allows to infer causes for the observed modifications, bringing new insights on skin cancer. This ill-posed problem is challenging, as skin features show strong inter- and intra-individual variations. This heterogeneity hinders automatic treatments, and requires ad hoc normalisation procedures [4] that do not always improve the classification accuracy [5]. To remedy this, the design of a similarity score between spectroscopic data that is robust to this variability plays a central role. Optimal transport (OT) is a fertile area of research, at the crossroads between probability, optimisation and PDEs. It allows to compare high-dimensional distributions based on their geometric features, unlike usual metrics such as the Euclidean distance. Informally, OT measures the amount of effort necessary to move mass from one distribution to the other. Recent works have shown that this type of metric is more relevant when comparing e.g. molecular spectra [6]. Unbalanced OT distances [7], allowing the comparison of non-normalised distributions, will be particularly investigated in this thesis. 2. Research work A key insight underlying this proposal is that integrating OT in our processing workflow will address the previous challenges and reduce the sensitivity of methods to intra and inter-individual variability. Our goal is to study from both a theoretical and a numerical perspectives the use of unbalanced OT distances as similarity metrics between spectra in the inverse estimation of OP from spectroscopic data. More precisely, it will address the following three major challenges. (A) The unbalanced extension of OT allows to handle distributions with different normalisations. This is particularly relevant in our context where in vivo data suffer from normalisation issues. Benchmarking the performance of these unbalanced metrics will be the first aim of this thesis, measuring in particular their performance for blindly clustering AF or DR spectra. (B) Fitting Monte Carlo models to spectroscopic data, in order to estimate OP of skin tissues, requires to design adequate loss functions over spectra. The second part of this proposal is to study the use of unbalanced OT distances as data fitting terms in the inverse estimation. We will investigate how to model imbalance between our spectral distributions, with the goal of finding a compromise between reliable recovery and numerical tractability. In particular, we will resort to numerical approximations of unbalanced OT, such as entropic regularisation [8] or sliced OT distances [9]. (C) Although spectroscopic data display a high variability, there are correlations between OP markers of similar tissues. To leverage this, we will investigate the use of OT coupling terms between OP from several samples when solving the inverse problem (a similar idea has been considered in [10] for EEG/MEG data). These markers consist in vectors of coefficients (e.g. diffusion, absorption) depending on the wavelength, and can be modeled as vector-valued distributions. We will thus resort to vectorial OT to perform this coupling, adapting standard approximations of OT to this challenging vectorial setting.
Profil du candidat
Candidats ayant une formation en mathématiques appliquées au traitement des images et des signaux, à l'optimisation et aux problèmes inverses, avec une appétence pour l'ingénierie biomédicale et les applications dans le domaine des soins de santé.
Compétences de programmation en Matlab, Python ou Julia.
Candidate profile
Candidates with a background in mathematics applied to image and signal processing, optimisation and inverse problems, with an interest for biomedical engineering and applications in healthcare.
Programming skills in either Matlab, Python or Julia.
Référence biblio
[1] Apalla Z. et al. (2017) “Skin cancer: epidemiology, disease burden, pathophysiology, diagnosis, and therapeutic approaches”, Dermatology and Therapy, 7(S1) https://doi.org/10.1007/s13555-016-0165-y
[2] Blondel et al. (2021) “Spatially-Resolved Multiply-Excited Autofluorescence and Diffuse Reflectance Spectroscopy: SpectroLive Medical Device for Skin In Vivo Optical Biopsy”, Electronics, 10(3):243. https://doi.org/10.3390/electronics10030243
[3] Elsen T. et al. (2024) “A dataset of optical spectra and clinical features acquired on human healthy skin and on skin carcinoma”, Data in Brief, 53:110163. https://doi.org/10.1016/j.dib.2024.110163
[4] Colas et al. (2023) “Photometric and Monte-Carlo modeling unified approach for the calculation of spatially-resolved correction coefficients linking simulated and experimental diffuse reflectance spectra,” Optics Express, 31(16), 25954-25969. https://doi.org/10.1364/OE.491921
[5] Kupriyanov et al. (2025) “Machine learning–based classification of spatially resolved diffuse reflectance and autofluorescence spectra acquired on human skin for actinic keratoses and skin carcinoma diagnostics aid”, Journal of Biomedical Optics, 30(3):035001. https://doi.org/10.1117/1.JBO.30.3.035001
[6] Seifert et al. (2022) “Computational optimal transport for molecular spectra: The fully continuous case”, Journal of Chemical Physics, 159(16):4110. https://doi.org/10.1063/5.0166469
[7] Chizat et al. (2018) “Unbalanced optimal transport: Dynamic and Kantorovitch formulations”, Journal of Functional Analysis, 274(11):3090–3123. https://doi.org/10.1016/j.jfa.2018.03.008
[8] Chizat et al. (2018) “Scaling algorithms for unbalanced optimal transport problems”, Mathematics of computation, 87:2563–2609. https://doi.org/10.1090/mcom/3303
[9] Bonet et al. (2025) “Slicing unbalanced optimal transport”, preprint.
[10] Janati et al. (2019) “Wasserstein regularization for sparse multi-task regression”, Proceedings of AISTATS, 89:1407.