Parution du vade-mecum « Les données de recherche en sciences humaines et sociales »
#NOUVELLES DE L'INSTITUT
Dans La Lettre no93 de juillet 2025, Marie Gaille, alors directrice de CNRS Sciences humaines & sociales, exposait les défis auxquels la recherche scientifique est aujourd’hui confrontée dans de nombreux pays. Outre les contraintes budgétaires, elle soulignait les risques d’arrêt de la production, de déconnexion et parfois de suppression de bases de données dans certains champs disciplinaires ciblés, ainsi que les risques d’appropriation des données par des acteurs autres que ceux qui les ont produites ou collectées.

Ces constats soulignent la nécessité, pour la recherche scientifique, de s’appuyer sur un écosystème national et souverain en matière de données. Celui-ci repose sur des infrastructures, des dispositifs et des outils permettant de produire, de collecter, de partager et de réutiliser des données de qualité, accessibles dans la durée et hébergées dans des environnements numériques sécurisés. La science ouverte offre précisément un cadre pour répondre à ces enjeux.
Dans cette perspective, l’institut soutient les infrastructures de recherche étoile Huma-Num et Progedo. Ces dernières ont permis de déployer de nombreux services dédiés aux données à destination de la communauté scientifique en sciences humaines et sociales. En complément d’autres dispositifs, elles ont contribué à structurer l’écosystème des données et à apporter des réponses concrètes en matière de gestion et de partage : par exemple, des outils pour le traitement, des moyens de calcul et de stockage, des dispositifs d'accompagnement, ainsi que des plateformes d'accès et de diffusion.
La journée des laboratoires, des réseaux et des programmes de recherche de l’institut, organisée en juin 2025, a révélé une connaissance disparate de cet écosystème. Par ailleurs, le rapport de prospective publié à la même période identifiait, par champs thématiques, des outils et des dispositifs dans lesquels les données de recherche occupent une place importante.
C’est dans ce contexte que la direction de CNRS Sciences humaines & sociales a sollicité la rédaction d’un vade-mecum consacré aux données en SHS. Ce dernier, élaboré de manière concertée, est désormais publié et accessible en ligne. Ce document s’adresse en priorité aux directrices et directeurs d’unités, ainsi qu’aux responsables de programmes et de projets rattachés à l’institut. En vue de déployer progressivement des dispositifs et des outils identifiés dans la prospective, il semblait nécessaire de partager une compréhension commune de cet écosystème dans un document unique. Générique, il a été conçu, d'une part, pour embrasser la diversité disciplinaire en sciences humaines et sociales ; de l’autre, pour être aussi compréhensible que possible par ses principaux destinataires.
Le vade-mecum rappelle d’abord les grands principes qui constituent la politique de l’institut en matière de gestion des données. Dans les projets et les grands programmes de recherche, celle-ci n'est pas un sujet secondaire, mais bien une composante essentielle de la démarche scientifique ainsi qu'un facteur de réussite de ces derniers. Envisagée suffisamment en amont, elle permet d’anticiper collectivement le devenir des données et leur dépôt dans un environnement numérique pérenne, qu’elles soient ou non associées à une publication. Elle contribue aussi, selon la nature des données, à organiser leur partage avec la communauté scientifique à des fins de réutilisation, leur ouverture à des acteurs extérieurs au monde académique ou, a minima, de signaler leur existence grâce à des métadonnées. Cette question peut devenir centrale au sein des laboratoires dans lesquels les données occupent une place importante et constituent un patrimoine scientifique à préserver. Définir des règles communes de gestion et de partage à l’échelle du laboratoire, par exemple au moyen d’une politique de données, permet d’établir un cadre commun et de dépasser certaines pratiques individuelles. Une telle démarche favorise une meilleure connaissance des données produites, ainsi que la mise en place de règles de collecte, de traitement, de stockage, de sécurité et, le cas échéant, d’archivage.
Il s'agit également de rappeler que les données produites dans le cadre de la recherche publique ont vocation à être « aussi ouvertes que possible et aussi fermées que nécessaire ». Ce principe revêt une importance particulière en SHS où les données à caractère personnel et les données sensibles sont nombreuses. Ce principe suppose également de réfléchir très en amont aux modalités de partage adaptées à la nature des données, y compris lorsqu'elles sont encadrées par des droits ou des règlementations particulières. La question de l’ouverture et du partage des données doit ainsi être envisagée à différentes échelles, afin qu’elles puissent constituer un patrimoine scientifique commun.
Le vade-mecum entend aussi éclairer un écosystème national des données en SHS en constante évolution. Il a pour objectif non seulement de faciliter l’identification des infrastructures, des services et des dispositifs sur lesquels les laboratoires et programmes de recherche peuvent s'appuyer, mais aussi de signaler d’autres outils, plateformes technologiques et dispositifs d’accès aux données utiles pour les communautés en SHS.
Enfin, le vade-mecum s’inscrit dans une perspective plus large pour structurer et déployer une stratégie institutionnelle spécifiquement dédiée aux données. Mettre en œuvre et outiller cette politique nécessite de l'ancrer au plus près des communautés de recherche. Dans cette perspective, les réseaux thématiques, les réseaux prospectifs, les pôles éditoriaux, les grands programmes et des dispositifs tels que les SOSI (Suivi ouvert des sociétés et de leurs interactions) sont des espaces privilégiés pour initier des actions concrètes. Citons à titre d’exemple le développement du lien entre données et publications au sein des revues scientifiques à l'échelle du Campus Condorcet, ou encore la mise en place, plus récemment, d’un travail collectif sur l'application du Règlement général sur la protection des données (RGPD) dans le cadre des enquêtes en sciences humaines et sociales.
CNRS Sciences humaines & sociales positionne, dans le sillage de la politique du CNRS, la science ouverte comme un de ses missions essentielles. De longue date, l’institut est reconnu comme un acteur de premier plan en matière d’édition scientifique, notamment à travers son soutien à OpenEdition, aux pôles éditoriaux et aux revues. Le pan des données de la recherche constitue désormais un axe d’actions à part entière, pour lequel ce vade-mecum pose les premiers jalons d’une stratégie institutionnelle, dans le prolongement de la politique impulsée à l’échelle du CNRS.
Mathilde Bernier, chargée du soutien la gestion et à la diffusion des données de recherche
En collaboration avec Lionel Maurel, co-responsable Édition scientifique et développement de l'accès ouvert et correspondant juridique à la Direction des données ouvertes de la recherche (DDOR) du CNRS, et Astrid Aschehoug, responsable du pôle Science ouverte, édition scientifique et données de recherche.