Trois questions à Didier Breton, Laurence Rageot et Fatiha Idmhand, sur les données de la recherche au sein des MSH
En 2016, la loi pour une République numérique est promulguée. S’ensuivent les publications, en 2018, du plan national pour la science ouverte, en 2019, de la Feuille de route du CNRS pour la science ouverte, en 2020, du plan de données de la recherche du CNRS. En 2020, le CNRS crée la Direction des données ouvertes de la recherche (DDOR). La gouvernance de la DDOR s’appuie sur un comité de pilotage où sont représentés les dix instituts du CNRS. La mise en exergue des données de la recherche, leur prise en compte tout au long, et au-delà, du déploiement d’un projet de recherche ont entraîné des modifications, dans la façon de « faire la recherche » que ce soit pour les chercheurs et chercheuses eux-mêmes, ou pour les personnels d’appui à la recherche. Professeur de démographie à l’université de Strasbourg, chercheur associé à l’Ined, Didier Breton est directeur de la Maison Interuniversitaire des Sciences de l'Homme - Alsace (MISHA, USR3227, CNRS / Université de Haute-Alsace / Université de Strasbourg). Ingénieure de recherche CNRS, Laurence Rageot est coordinatrice de l’Atelier Numérique, au sein de la Maison des Sciences de l’Homme Val-de-Loire (MSH VdL, USR3501, CNRS / Université de Tours / Université d’Orléans). Fatiha Idmhand, professeur des universités, université de Poitiers, membre de l’Institut des textes et manuscrits modernes (ITEM, UMR8132, CNRS / ENS Paris). Tous trois reviennent sur les pratiques mises en place au sein des MSH en matière de science ouverte et de traitement des données de la recherche.
Comment appréhendez-vous le cycle de la donnée, au sein de votre MSH, quelles en sont les implications ?
Didier Breton – Les données en SHS, comme dans les autres domaines, sont partout, mais prennent, peut-être, des formes plus variées : photos, sons, entretiens, données d’enquête, références bibliographiques, notices, textes, images, entre autres ! Les corpus de données ne manquent pas… En revanche, d’autres choses manquent terriblement : non seulement une sensibilisation aux bonnes pratiques, mais aussi des ressources matérielles et humaines. Et là, la présence d’une Maison des Sciences de l’Homme sur un site universitaire prend tout son sens. C’est en tout cas le cas en Alsace avec la Maison Interuniversitaire des Sciences de l’Homme – Alsace (MISHA).
Une MSH est avant tout un lieu de mutualisations. Mutualisation de matériel d’abord : c’est le cas pour la collecte et la « fabrication» de données demandant du matériel souvent coûteux et trop peu exploité une fois acquis, notamment s’il est attaché à une seule unité de recherche. Les plateformes techniques mutualisées apportent alors une réponse pour de la numérisation, de la captation de mouvements ou de sons, ou encore pour les salles d’expérimentation… Ces plateformes, présentes depuis longtemps dans les sciences fondamentales, apparaissent de plus en plus dans les sciences humaines et sociales et sont de plus en plus souvent hébergées et gérées par les MSH. C’est le sens de notre projet « Collecter Organiser et Valoriser les Données en SHS » (COVD-SHS) développé au sein de la région Grand Est, porté notamment par la MISHA et la Maison des Sciences de l'Homme Lorraine (MSH Lorraine, USR3261, CNRS / Université de Lorraine). Mutualisation aussi de ressources humaines… Dans les MSH, des personnels au service de l’ensemble des unités du site auquel il appartient agissent au quotidien pour l’utilisation et la valorisation des données. Leur utilité va au-delà des simples services rendus. La diversité des situations, des disciplines dans et avec lesquelles ils évoluent leur apporte une connaissance large des données et de leur traitement, développe chez eux une capacité à établir des ponts entre les disciplines et les pratiques dans l’exploitation des données — bref, apportent une vision transverse de la question des données. Mutualisation des bonnes pratiques, enfin. C’est le cas des enjeux associés au développement d’une science des données en SHS, comme ceux liées à la science ouverte ou encore aux règlements généraux sur la protection des données (RGPD). L’anticipation et la formation aux bonnes pratiques, vécues parfois comme une perte de temps, entravant celui de la recherche, s’avèrent rapidement très vertueux et permettent un gain de temps considérable pour les chercheurs et chercheuses. Ce souci de mutualisation est au cœur des plateformes de la MISHA : la Plateforme en Humanités Numériques (PHuN), la Plateforme Universitaire de Données (PUD-S), mais aussi le pôle d’Édition OUVROIR et sa pépinière de revues. Les six ingénieurs d’études qui y travaillent au quotidien et œuvrent ainsi à ces mutualisations, donnent toujours plus de sens et d’ouverture aux données de la recherche, dans une perspective pluridisciplinaire mis en œuvre aussi souvent que possible !
En tant que responsable de l’atelier numérique à la MSH Val-de-Loire, quelles sont les évolutions des pratiques des chercheurs et chercheuses que vous avez pu constater depuis dix ans ? Quelles en sont les implications sur les métiers d’ingénierie ?
Laurence Rageot – L’atelier numérique de la MSH Val de Loire existe depuis dix ans. Nous avons constaté une évolution des demandes de services que nous recevons. Les premières années, nous étions sollicités pour des sites web de projet que je qualifierai de « site vitrine » ne comprenant aucune donnée de recherche mais permettant d’attester de l’existence d’un projet, ou pour des bases de données de travail. Ce type de bases de données, pour lesquelles nous sommes encore sollicités, permettent aux chercheurs et chercheuses de mener collectivement leurs recherches et d’établir les résultats qui seront publiés dans des revues. Elles sont publiées sur internet mais ne permettent que rarement la réutilisation des résultats. Désormais, parallèlement à ce type de demandes, d’autres projets s’engagent dans la publication de leurs données de recherche dans le web des données grâce au web sémantique.
Ces travaux menés conjointement avec le consortium MASA (Mémoire des archéologues et des sites archéologiques), labellisé par l’infrastructure de recherche Huma-Num, nous ont amené à renforcer l’équipe de l’Atelier Numérique pour accompagner les chercheurs dans l’appariement de leurs données avec des ontologies de domaine (le CIDOC-CRM1 ) pour les archéologues et tous les travaux sur le patrimoine culturel) et à contribuer à la poursuite des développements du composant Sparnatural permettant de construire visuellement des requêtes SPARQL2 pour interroger des jeux de données hétérogènes publiés sur le web au format RDF.
Toutefois, cette évolution des sollicitations, qui n’est pas similaire dans toutes les disciplines, requiert également que toute l’équipe de l’Atelier Numérique se forme en continu aux nouvelles technologies et aux nouvelles méthodes. C’est une nécessité non seulement pour les développeurs web qui doivent s’adapter aux évolutions technologiques, mais également pour tous les membres de l’atelier car nous assurons l’accompagnement des chercheurs et chercheuses sur l’intégralité du cycle de vie des données quelle qu’en soit la nature (textuelle, iconographique, musicale, spatiale, audiovisuelle…) : de leur création et leur traitement à leur diffusion, le stockage à court et moyen terme, mais également l’aide sur le plan de gestion de données, le tout dans le respect des principes FAIR.
À quels services des Maisons des Sciences de l’Homme avez-vous recours pour organiser vos données scientifiques ? Quelle est votre expérience et qu’en pensez-vous ?
Fatiha Idmhand – Les instruments et plateaux techniques ne sont pas les seuls services qu’offrent les Maisons des Sciences de l’Homme pour contribuer aux travaux sur les données. Bien sûr, lorsque ces équipements de capture de données existent, comme c’est le cas à la Maison des Sciences de l'Homme et de la Société de Poitiers (MSHS Poitiers, USR3565, CNRS / Université de Poitiers / Université de Limoges), ils rendent de très grands services aux chercheurs et aux chercheuses. Actuellement, j’ai la chance de disposer de conditions idéales pour la réalisation de mon projet CollEx « Archivos 3.0 » (2020-2022) car les manuscrits et archives au cœur du programme sont hébergés au premier étage de la MSHS par l’équipe « Archivos » de l’Institut des textes et manuscrits modernes, et l’archiviste recruté grâce à CollEx n’a qu’à se rendre au rez-de-chaussée pour accéder à la plateforme technique. Là, il réalise les opérations de conversion en données des archives et saisit une partie des métadonnées. L’équipement de cette MSH permet aux projets en humanités numériques d’éviter le recours à la prestation externe et de dégager des moyens pour financer d’autres tâches essentielles telles que l’enrichissement des métadonnées et l’accompagnement au stockage des données dans un entrepôt sécurisé, comme par exemple celui d’Huma-Num : Nakala.
Lorsque de tels instruments n’existent pas dans les MSH, et c’était le cas lorsque je travaillais dans la région Hauts-de-France, il est possible de compter sur d’autres services tout aussi importants tels que l’accompagnement au dépôt de projets (ANR, ERC, etc.) La constitution des jeux de données indispensables aux études scientifiques requiert d'importantes ressources financières car ces tâches sont coûteuses et, le plus souvent, ce sont les financements sur projets qui apportent ces moyens. De ce point de vue, les services proposés par la Maison Européenne des Sciences de l'Homme et de la Société (MESHS, USR3185, CNRS / Université de Lille) sont extrêmement précieux. La MESHS réalise une veille et un accompagnement importants des chercheurs et chercheuses lors des appels à projets. Il s’agit d’une expertise essentielle. J’ai été très bien accompagnée par la MESHS pour la préparation de mon projet ANR « Jeunes chercheurs/euses » (projet « CHispa » 2014-2017). Cela m’a permis de constituer deux fonds documentaires numériques, de créer plusieurs milliers de données et de métadonnées, et de développer toute une méthodologie (workflow) pour la création de données numériques à partir des fonds d'archives et manuscrits d'auteurs.
Propos recueillis par Myriam Danon-Szmydt, secrétaire générale du RnMSH