*

ENACT - Et le gagnant est... AlphaFold !

Offre de thèse

ENACT - Et le gagnant est... AlphaFold !

Date limite de candidature

15-04-2026

Date de début de contrat

01-10-2026

Directeur de thèse

HOCQUET Alexandre

Encadrement

The work is part of the ENACT project is to be supervised by Frédéric Wieber and Alexandre Hocquet, historians of science whose research interests are the influence of software on scientific practices. Both of them are members of the Unité Mixte de Recherche Archives Poincaré, which hosts a vibrant community of scholars dedicated to History and Philosophy of Science.

Type de contrat

Financement d'un établissement public Français

école doctorale

SLTC - SOCIETES, LANGAGES, TEMPS, CONNAISSANCES

équipe

contexte

The project is part of a broader initiative about the entanglement of openness, reproducbility, computer simulations and scientific software, with Johannes Lenhard at the RPTU in K'Lautern, Marcus Carrier at the University of Bielefeld, Arianna Borrelli and Gabriele Gramelsberger at the RWTH in Aachen, and Sabina Leonelli at TU München.

spécialité

Epistémologie histoire des sciences et techniques

laboratoire

AHP-PReST - Archives Henri Poincaré - Philosophie et Recherches sur les Sciences et les Technologies

Mots clés

Histoire des Sciences, STS

Détail de l'offre

La reconnaissance d'AlphaFold par le Comité Nobel 2024 souligne une approche singulière de la science, axée sur des compétitions et des concours périodiques. Si AlphaFold a permis de réaliser des progrès significatifs dans la prédiction des structures protéiques, il n'élucide pas les mécanismes sous-jacents du repliement des protéines. Il n'en demeure pas moins une réussite de l'IA dans le domaine de la biologie structurale.

AlphaFold peut être analysé dans le cadre d'un système de promesses technoscientifiques (Joly, 2010). Conçu par DeepMind, filiale de Google, AlphaFold vise les grands groupes pharmaceutiques en proposant une nouvelle méthode de découverte de médicaments et en revendiquant des traitements potentiels contre le cancer. L'attrait du repliement des protéines comme domaine d'application pour des initiatives de 'gamification' telles que Foldit ou Fold@Home éclaire également les stratégies de DeepMind, entreprise qui s'est fait un nom dans le jeu vidéo et la commercialisation de performances d'IA, à l'instar d'AlphaGo, un joueur de go automatisé lancé en grande pompe en 2016. Ce lien entre jeu et résolution de problèmes scientifiques met en lumière une culture de la 'démo' (Rosental, 2021), typique de la Silicon Valley, et plus largement de l'informatique.

Le succès du 'Deep Learning' appliqué au repliement des protéines repose sur une puissance de calcul inaccessible au monde académique. Il dépend également de la disponibilité de jeux de données pour l'entraînement. Le caractère ouvert des données de la 'Protein Data Bank' (Strasser, 2019) est reconnu comme important pour l'entraînement d'Alphafold. Cependant, pour Google et la Silicon Valley en général, il a toujours été stratégique de tirer profit d'une base de données ou d'un code source ouvert, puis de gérer les subtilités de l'ouverture ou de la fermeture à des moments précis, un processus que l'on pourrait qualifier d'«openwashing».

Parallèlement, depuis les années 1990, toute la communauté du repliement des protéines est habituée à une culture épistémique de concours. Le CASP (Critical Assessment of Structure Prediction) est un concours bisannuel où des équipes de recherche du monde entier concourent simultanément sur les mêmes protéines. Le concours CASP est l'événement majeur de la communauté depuis trente ans, et témoigne d'une approche scientifique axée sur des compétitions périodiques de résolution de problèmes. CASP précède de vingt ans l'intérêt de Google pour le repliement des protéines. Il constitue un élément central de cette communauté, et l'objet de cette thèse sera d'analyser ce qui est considéré comme une réussite scientifique entre succès prédictif et compréhension des causes et des modalités d'échec des modèles.

L'approche du CASP semble parfaitement compatible avec la culture de la démonstration et a ouvert la voie au succès futur de Deepmind. Mais quelle est l'histoire du CASP sur deux décennies? Dans quel contexte et avec quels objectifs a-t-il été créé? Comment et pourquoi a-t-il ancré cette culture épistémique des concours, et comment a-t-il évolué au fil du temps, dans ses relations avec la communauté de la cristallographie et avec la Silicon Valley? Les subtilités épistémiques internes du CASP sont-elles cohérentes avec cette vision à grands traits d'une «science de concours»? Dans quelle mesure a-t-il façonné la communauté du repliement des protéines? Quel est le lien avec les problématiques logicielles (Hocquet et al., 2024)? Au-delà des projets CASP et Alphafold, l'objectif est donc de comprendre comment et dans quelle mesure l'IA s'immisce dans la science.

Ce doctorat s'inscrit donc dans une perspective d'histoire des sciences, qui s'intéresse aussi bien aux enjeux épistémiques qu'au contexte social, industriel, culturel et politique du repliement des protéines et de l'IA.

Keywords

History of Science, STS

Subject details

The acknowledgment of AlphaFold by the 2024 Nobel Committee ironically underscores a peculiar approach to science that revolves around periodic competitions and contests. While AlphaFold has made significant strides in predicting protein structures, it does not elucidate the underlying mechanisms of protein folding. Still, it is indeed an AI success story in the realm of structural biology, beyond the ubiquitous chatbots. AlphaFold can also be analyzed in terms of a techno-scientific promise regime (Joly, 2010). Designed by Deepmind, a Google subsidiary, Alphafold is marketed towards Big Pharma by providing a new method for drug discovery and development and claiming potential cancer cures. The appeal of protein folding as a domain for gamified initiatives like Foldit or Fold@Home also sheds light on the strategies of DeepMind, a company that made a name of itself in video-gaming and the marketing of AI performances, like AlphaGo, an automated Go player released in great fanfare in 2016. The connection between gaming and scientific problem-solving highlights the demo culture (Rosental, 2021), the typical ‘demo culture' of the Silicon Valley, and computer science at large. The success of machine learning in protein folding relies on an amount of (corporate) computational power and personnel that is unreachable in Academia. It also relies on the availability of datasets. The open nature of the Protein Data Bank (Strasser, 2019) is recognized as a significant resource for the training of Alphafold, but it has always been a core strategy, for Google and the Silicon Valley in general, to benefit from an open database or source code and then navigate through the minutiae of being open or closed at chosen points in time, a process than can be called openwashing. And yet, the validation of Alphafold's success does not come from the PR departments at Google. Beyond Alphafold, the aim of this PhD thesis is to analyze the role of the so-called “Critical Assessment of Structure Prediction” (CASP). Parallel to this, the whole community of protein folding has been habituated to an epistemic culture of contests since the 1990s. The so-called Critical Assesment of Structure Prediction (or CASP) is a biennial contest where research groups from all over the world compete simultaneously on the same proteins (whose 3D structures are temporarily known by the sole organizers). The CASP contest has been the major event in the community for thirty years, a way of doing science that focuses on periodic puzzle solving competitions. CASP predates Google's interest in protein folding by twenty years. It is a core component of this community, and CASP defines what is considered a scientific achievement by focusing on (incremental) success more than on understanding when and how models can fail. This looks completely compatible with the demo culture, and looks like paving the way for eventual Google success, but what is the history of CASP over two decades ? In what context was the CASP created and with what aims ? How and why did it embed this epistemic culture of contests, and how did it evolve over time, in its relationship with the crystallography community and then with the Silicon Valley ? Are the inner epistemic intricacies of CASP consistent with this caricatural vision of a “science of contests” ? To what extent did it shape the protein folding community ? How does this relate to software issues (Hocquet et al., 2024) ? Beyond the CASP and Alphafold, the aim is to understand in which ways and to what extent AI is invading science. This PhD is thus a History of Science project, concerned with what is epistemically at stake but also informed by the social, industrial, cultural and political context around protein folding and AI.

Profil du candidat

On attend des candidat.e.s d'avoir une solide formation en HPS et STS, une maîtrise robuste de la langue anglaise, et une appétence pour les mondes de la biologie structurale, des sciences computationnelles et du software en général. Un intérêt pour les humanités numériques et le bricolage sur ordinateur en général seraient un plus.

Candidate profile

The applicant is expected to have a solid background in HPS and STS, a robust command of the English language, and an appetence for the worlds of structural biology, computational science and software in general. An interest for digital humanities and toying with computers in general would be a plus.

Référence biblio

Hocquet, Alexandre, Frédéric Wieber, Gabriele Gramelsberger, Konrad Hinsen, Markus Diesmann, Fernando Pasquini Santos, Catharina Landström, et al. “Software in Science Is Ubiquitous yet Overlooked.” Nature Computational Science 4, no. 7 (July 1, 2024): 465–68. https://doi.org/10.1038/s43588-024-00651-2.

Joly, Pierre-Benoît. “On the economics of techno-scientific promises.” In Débordements, edited by Madeleine Akrich, Yannick Barthe, Fabian Muniesa, and Philippe Mustar, 203–21. Presses des Mines, 2010. https://doi.org/10.4000/books.pressesmines.747.

Rosental, Claude. The Demonstration Society. Translated by Catherine Porter. Infrastructures. Cambridge: The MIT Press, 2021.

Strasser, Bruno J. Collecting Experiments: Making Big Data Biology. Chicago: The University of Chicago Press, 2019.

Ann Johnson, Johannes Lenhard. “Cultures of Prediction: How Engineering and Science Evolve with Mathematical Tools”, The MIT Press, 2024

Leonelli, Sabina. “Philosophy of Open Science” Cambridge University Press, 2023