*

Extraction de chronologies et raisonnement temporel pour le diagnostic clinique en milieu d'urgence et en cardiologie

Offre de thèse

Extraction de chronologies et raisonnement temporel pour le diagnostic clinique en milieu d'urgence et en cardiologie

Date limite de candidature

25-04-2026

Date de début de contrat

01-09-2026

Directeur de thèse

GARDENT Claire

Encadrement

The thesis will be co-supervised by • Claire Gardent, LORIA (CNRS, Université de Lorraine), Nancy • Nicolas Girerd, CHRU de Nancy, Inserm U1116 et CIC-P, Nancy • Adrien Coulet, Inria Paris, Paris

Type de contrat

Plan Investissement d'Avenir (Idex, Labex)

école doctorale

IAEM - INFORMATIQUE - AUTOMATIQUE - ELECTRONIQUE - ELECTROTECHNIQUE - MATHEMATIQUES

équipe

SYNALP

contexte

The PhD will be conducted at LORIA (Computer Science Lab) and at the Centre d'Investigation Clinique Plurithématique (CIC-P 1433) of the Nancy University Hospital (CHRU de Nancy). LORIA is a large (500 staff) Computer Science Research lab. The CIC-P is a clinical research infrastructure supported by INSERM, the CHRU de Nancy and Université de Lorraine. It is at the point where basic research and applied medical research meet. It does studies into the causes of diseasesand how they work, and how to treat them. It mostly does these studies in the heart and kidneys, and in heart failure. It gives investigators special facilities and expertise for designing, doing and analysing clinical studies. The CIC-P hosts the long-standing Stanislas cohort and coordinates many national and international projects. The centre has a strong methodological and data-science platform, including clinical investigation, project management, data management and statistical/AI analyses (three biostatisticians and two data scientists). This environment offers strong clinical, regulatory and data-quality support for developing and evaluating LLM-based methods using real-world hospital data together with strong expertise in LLM for NLP.

spécialité

Informatique

laboratoire

LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications

Mots clés

TAL, LLM, Santé

Détail de l'offre

L'objectif de cette thèse est de concevoir, d'analyser et d'évaluer des méthodes basées sur des modèles linguistiques multimodaux de grande envergure (LLM) afin de reconstruire et d'exploiter les parcours de soins des patients à partir des dossiers médicaux électroniques (DME) français, avec une première application à la dyspnée aiguë et à l'insuffisance cardiaque aiguë. À terme, ces parcours de soins sont destinés à alimenter des outils de prédiction et d'aide à la décision en ligne susceptibles d'améliorer la prise en charge des patients et d'optimiser le recours et le moment des examens diagnostiques dans les services d'urgence et de cardiologie.

Les récits cliniques du CHRU de Nancy (par exemple, la cohorte PARADISE) contiennent des informations riches mais hétérogènes sur les symptômes, les traitements, les comorbidités et l'évolution clinique. Ces données sont complétées par des mesures structurées et horodatées (signes vitaux, analyses de laboratoire, imagerie, diagnostics). Si des travaux antérieurs ont démontré la faisabilité de l'extraction de concepts à l'aide de dictionnaires basés sur des ontologies et de modèles de transformateurs, deux défis majeurs restent largement à relever :

- Reconstruction temporelle : replacer les événements cliniques sur une chronologie cohérente du patient, malgré l'absence d'horodatage, les expressions temporelles relatives (« il y a un mois », « depuis hier ») et les pratiques de documentation hétérogènes entre les services (urgences, cardiologie, services hospitaliers).

- Aide à la décision cliniquement pertinente : évaluer comment ces chronologies peuvent soutenir le raisonnement clinique, par exemple le diagnostic différentiel de la dyspnée aiguë, la stratification des risques dans l'insuffisance cardiaque aiguë ou l'anticipation d'une décompensation.

Keywords

NLP, LLM, Health data

Subject details

The goal of this PhD is to design, analyse and evaluate methods based on multimodal large language models (LLMs) to reconstruct and exploit patient trajectories from French electronic health records (EHR), with a first application to acute dyspnea and acute heart failure.Ultimately, these trajectories are intended to feed online prediction and decision-support tools that can improve patient management and optimise the use and timing of diagnostic examinations in emergency and cardiology settings. Clinical narratives at Nancy CHRU (e.g., PARADISE cohort) contain rich but heterogeneous information about symptoms, treatments, comorbidities, and clinical evolution. These data are complemented by structured time-stamped measurements (vital signs, laboratory tests, imaging, diagnoses). While previous work has demonstrated the feasibility of concept extraction using ontology-based dictionaries and transformer models, two key challenges remain largely open: - Temporal reconstruction: placing clinical events on a coherent patient timeline, despite missing timestamps, relative temporal expressions (“one month ago”, “since yesterday”) and heterogeneous documentation practices between services (emergency, cardiology, hospital wards). - Clinically meaningful decision support: assessing how such timelines can support clinical reasoning, e.g., differential diagnosis of acute dyspnea, risk stratification in AHF, or anticipation of decompensation.

Profil du candidat

Nous recherchons des candidats possédant une solide formation en informatique, en traitement du langage naturel (NLP) et/ou en apprentissage profond. Le candidat doit disposer de solides compétences en programmation, être capable de faire preuve de créativité et s'intéresser au traitement du langage naturel.

Compétences requises
- Diplôme universitaire (master ou équivalent) obtenu dans un domaine pertinent tel que l'informatique ou le traitement du langage naturel
- Maîtrise du français et de l'anglais à l'oral et à l'écrit.
- Excellente maîtrise de Python et Pytorch.
- Intérêt pour la recherche en traitement du langage naturel

Candidate profile

We are looking for candidates with a strong background in computer science, natural language processing (NLP) and/or deep learning. The candidate should have strong programming skills, should be able to think creatively and be interested in NLP.

Skills required

- Successfully completed university degree (Master or comparable) in a relevant field like Computer Science or Natural Language Processing
- Proficiency in spoken and written French and English.
- Excellent proficiency in Python and Pytorch.
- Research interest in Natural Language Processing

Référence biblio

1. Parshall MB, Schwartzstein RM, Adams L, Banzett RB, Manning HL, Bourbeau J, et al. An official American Thoracic Society statement: update on the mechanisms, assessment, and management of dyspnea. Am J Respir Crit Care Med 2012;185:435– 452.

2. Kelly AM, Keijzers G, Klim S, Graham CA, Craig S, Kuan WS, et al. An Observational Study of Dyspnea in Emergency Departments: The Asia, Australia, and New Zealand Dyspnea in Emergency Departments Study (AANZDEM). Acad Emerg Med 2017;24:328–336.

3. Chouihed T, Manzo-Silberman S, Peschanski N, Charpentier S, Elbaz M, Savary D, et al. Management of suspected acute heart failure dyspnea in the emergency department: results from the French prospective multicenter DeFSSICA survey. Scand J Trauma ResuscEmerg Med 2016;24:112.

4. Baudry G, Lacomblez C, Bresso E, Monzo L, Mebazaa A, Duarte K, et al. Short and Long-Term Prognosis of Hospitalization for Dyspnea Based on Etiology and Hospitalization Ward: Insights from the PARADISE Cohort. Eur J Heart Fail 2026:xuaf027.

5. Chenhan Yuan, Qianqian Xie, and SophiaAnaniadou. 2023. Zero-shot Temporal Relation Extraction with ChatGPT. In Proceedings of the 22nd Workshop on Biomedical Natural Language Processing and BioNLP Shared Tasks, pages 92–102, Toronto, Canada. Association for Computational Linguistics.

6. Andrew JJ, Potier J, Garcelon N, Burgun A, Vincent M. Using large language models for temporal relation extraction from pediatric clinical reports. JAMIA Open. 2025 Nov 22;8(6):ooaf121. doi:10.1093/jamiaopen/ooaf121. PMID: 41281245; PMCID: PMC12640238.

7. Siheng Xiong, Ali Payani, Ramana Kompella, and Faramarz Fekri. 2024. Large Language Models Can Learn Temporal Reasoning. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 10452–10470, Bangkok, Thailand. Association for Computational Linguistics.

8. Bramsen P, Deshpande P, Lee YK, Barzilay R. Finding temporal order in discharge summaries. AMIA Annu Symp Proc. 2006;2006:81-5. PMID: 17238307; PMCID: PMC1839632.

9. A. Leeuwenberg and M. -F. Moens, 'Towards Extracting Absolute Event Timelines From English ClinicalReports,' in IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 28, pp. 2710-2719, 2020, doi:10.1109/TASLP.2020.3027201. keywords: {Uncertainty;Speech processing;Probabilistic logic;Data mining;Predictive models;Information retrieval;Probability density function;Clinical records;implicit information;temporal information extraction;temporal uncertainty},