Prix de la science ouverte 2025 : 6 projets en sciences humaines et sociales
Le ministère de l’Enseignement supérieur, de la Recherche et de l’Espace a récompensé, pour la quatrième édition, des chercheurs et chercheuses, des projets et des équipes de recherche qui sont engagés dans la gestion et la diffusion des données de la recherche. Le 1er décembre 2025, cinq projets et une thèse de sciences humaines et sociales ont alors été couronnés de succès lors de la remise des prix des données de la recherche et du prix du logiciel libre de recherche.
Prix des données de la recherche
« Créer un jeu de données manquantes »
Cette première catégorie récompense des projets exemplaires dans la mise à disposition d’un nouveau jeu de données répondant à un besoin scientifique thématique. Les deux projets récompensés relèvent des sciences humaines et sociales.
Le premier, Corpus les Vocaux – SMS vocaux en français, est un projet constituant le premier corpus de SMS vocaux en français. Réalisé dans le cadre du projet ORALIDIA, et coordonné par Julie Glikman, professeure à l’université de Lorraine et membre du laboratoire Analyse et traitement informatique de la langue française (Atilf, UMR7118, CNRS / Université de Lorraine), ce corpus est une voie d’accès à la parole spontanée non surveillée, nécessaire pour la description de la langue naturelle et de ses variations. Ces données sont ainsi le lieu privilégié d’étude de la diffusion des formes émergentes ou de leur disparition, et du français parlé dans différents contextes, en particulier informels.
Le second projet récompensé dans cette catégorie est Subwork - les espaces suburbains de production : quels emplois populaires . Il propose une base de données recensant la structure, la géographie et les caractéristiques sociales des travailleurs et travailleuses en France en 2008 et 2018. Nicolas Raimbault, maître de conférences à Nantes Université et co-porteur du projet, est membre du laboratoire Espaces et sociétés (ESO, UMR6590, CNRS / Institut Agro / Le Mans Université / Nantes Université / Université d’Angers / Université Caen Normandie / Université Rennes 2). La base de données produite dans le cadre du projet Subwork (programme « Ville Productive » du PUCA) constitue un nouvel outil pour analyser, d’une part, la structure, les propriétés des emplois et des groupes professionnels et, d’autre part, leur géographie, au lieu de travail et au lieu de résidence jusqu’aux échelles infra-communales.
« Créer les conditions de la réutilisation »
La deuxième catégorie du prix de la science ouverte gratifie des projets illustrant un travail exemplaire de gestion des données de recherche afin de les rendre réutilisables.
Coordonnée par Julie Claustre, professeure à l’université Paris Cité et membre du laboratoire Europe États-Unis empires-post-empires, cultures, histoire, littératures, longue durée et sciences sociales (ECHELLES, UMR8264, CNRS / Université Paris Cité), et Darwin Smith, anciennement directeur de recherche CNRS au Laboratoire de médiévistique occidentale de Paris (Lamop, UMR8589, CNRS / Université Paris 1 Panthéon-Sorbonne), l’application e-NDP - Registres médiévaux numérisés de Notre-Dame de Paris, est une réalisation de la mission projets numériques de l'École nationale des chartes - PSL, développée dans le cadre du projet ANR e-NDP, « Notre-Dame de Paris et son cloître : les lieux, les gens, la vie ». Elle renouvelle la connaissance sur Notre-Dame de Paris via l’édition numérique de 26 registres médiévaux. La construction de ce corpus de registres a bénéficié de la participation de plusieurs membres du Lamop ainsi que du laboratoire ECHELLES. L’application, dont la structuration repose nativement sur les principes FAIR, permet la fouille de ce corpus inédit, et donne accès à toutes ressources produites et à la documentation.
« Mention spéciale du jury »
Cette troisième et dernière catégorie des prix des données de la recherche récompense des projets exemplaires de mise à disposition et d’enrichissement des données.
Le projet Panel de Caen met à disposition de la communauté scientifique les données d’une enquête débutée en 1995 auprès d’un panel de 87 jeunes. En suivant leurs parcours de vie sur 20 ans, et en analysant les évolutions de leurs réseaux relationnels, ce panel a comblé un manque dans la recherche sociologique, sur les plans thématique et méthodologique, en menant des enquêtes qualitatives et quantitatives. Cette enquête permet d’étudier en particulier la dynamique des parcours, les processus biographiques, les changements de projets, les bifurcations, la construction et l’évolution des rapports au travail, la vie de couple, la famille, les modes de sociabilité, ainsi que la création et l’évolution des relations des jeunes avec leur entourage, la structuration et les transformations de leur réseau personnel, la dynamique des interconnexions, et les effets des réseaux sur les processus de socialisation au fur et à mesure des transitions vers la vie adulte.
Ce projet est rendu possible grâce à l’investissement de trois équipes : le collectif de recherche du Panel de Caen, le centre de données socio-politiques (CDSP, UAR828, CNRS / Sciences Po) et le Laboratoire d'économie et de sociologie du travail (LEST, UMR7317, CNRS / Aix-Marseille Université). Il est coordonné par Claire Bidart, directrice de recherche CNRS au LEST.
Prix du logiciel libre de recherche
Le prix science ouverte du logiciel libre de recherche met en valeur les projets et les équipes de recherche qui œuvrent au développement et à la diffusion des logiciels libres et qui contribuent à la construction d’un bien commun de première importance.
Récompensé dans la catégorie « scientifique et technique », le projet QUantitative Modelling of Inflection (Qumin), est un paquet Python libre (GPLv3) qui modélise de manière quantitative la morphologie flexionnelle des langues, c’est-à-dire la façon dont les mots se déclinent et se conjuguent. Outil de recherche en linguistique computationnelle, Qumin permet d’analyser les régularités et les variations dans les systèmes grammaticaux des langues du monde. Initialement développé dans le cadre de la thèse de Sacha Beniamine, alors membre du Laboratoire de linguistique formelle (LLF, UMR7110, CNRS / Université Paris Cité), le logiciel est aujourd’hui utilisé par des étudiants de master ou par des linguistes n’ayant pas de formation en informatique, non seulement en France mais aussi à l’étranger.
Prix science ouverte de la thèse
Enfin, le prix science ouverte de la thèse a pour ambition d’encourager et de mettre en valeur les pratiques de science ouverte chez les doctorants. Le prix récompense les thèses soutenues pour lesquelles la pratique de la science ouverte a contribué à la qualité du travail scientifique.
Ainsi, dans la catégorie « sciences humaines et sociales », c’est Quentin Verriez, alors doctorant au laboratoire Archéologie, Terre, Histoire, Sociétés (ARTeHIS, UMR6298, CNRS / Ministère de la Culture / Université Bourgogne Europe), qui est récompensé pour sa thèse intitulée « Rationaliser les pratiques numériques en archéologie : l'exemple des chantiers de fouilles de Bibracte ». Cette thèse, inscrite dans un dispositif Cifre en partenariat avec l’Établissement public de coopération culturelle de Bibracte, explore la transition vers une archéologie numérique et ouverte. Elle se penche sur la faisabilité d'une fouille archéologique basée sur des logiciels libres, produisant des données transparentes, structurées et aux formats ouverts.
Pour la quatrième édition de cette remise de prix, les sciences humaines et sociales sont à l’honneur. Félicitations à toutes les chercheuses et tous les chercheurs récompensés !