MEMORIA, un système d’information exploratoire en ligne pour décrire des protocoles de recherche

Lettre de l'InSHS

#OUTILS DE LA RECHERCHE

De quelle manière les résultats de la recherche scientifique sont-ils produits ? De quelles informations avons-nous besoin pour assurer la traçabilité et la vérifiabilité de ces résultats ? C’est à ces questions que se propose de répondre MEMORIA, un système d’information exploratoire en ligne, conçu et développé au sein du laboratoire Modèles et simulation pour l’architecture et le patrimoine (MAP, UMR3495, CNRS / Ministère de la Culture), et permettant de documenter des résultats de recherche et de décrire les protocoles qui ont mené à leur création1 .

  • 1Dudek I., Blaise J.-Y., Rabefandroana M. 2022, MEMORIA. SI en ligne pour décrire des protocoles de recherche, Revue Des Nouvelles Technologies de l'Information, RNTI-E-38 : 453-460. http://memoria.gamsau.archi.fr/projet/pdf/MEMORIA_SI_RNTI.pdf

Pour répondre à quels enjeux ce système d’information MEMORIA a-t-il été conçu ?

La réflexion autour du système d’information MEMORIA a été amorcée en 2014, à partir des enjeux liés à la pérennisation d’informations sur les ressources numériques et les activités conduites au sein du laboratoire MAP. Ce projet à long terme visait la construction d’un système d’information exploratoire avec pour objectif la description, la structuration, l’archivage et l’analyse des ressources numériques produites [par le laboratoire].

En effet, une fois le projet de recherche achevé, il est souvent difficile de retracer les étapes qui ont conduit à un résultat, qu’il s’agisse de choix d’ordre technique ou bien d’ordre scientifique. Au fil du temps, les méthodes et techniques employées évoluent, entraînant une perte d’informations.

L’objectif du projet MEMORIA était de mettre au point un outil qui associe aux résultats scientifiques des indicateurs permettant de retracer la manière dont ces résultats ont été obtenus.

Pour ce faire, il a d’abord fallu identifier les besoins des utilisateurs, puis concevoir et mettre en place la structure du système d’information. L’étape suivante a été d’établir un vocabulaire contrôlé, et de procéder à une élicitation des connaissances propres au laboratoire (identification, structuration, définition et exemplification de toutes les activités).

Une interface visuelle a ensuite été conçue pour faciliter la navigation, l’accès et la visualisation des ressources. Les composantes et les fonctionnalités du système ont été implémentées progressivement. Le système d’information actuel est continuellement en cours d’évaluation et de développement.

À qui ce système d’information MEMORIA s’adresse-t-il ?

Le système d’information MEMORIA est accessible en ligne pour tous les utilisateurs, en mode navigation. Les modes d’édition et d’indexation sont réservés aux personnels du laboratoire MAP. Une plateforme de familiarisation avec les principes et l’interface du système — « bac à sable MEMORIA » — a été mise en ligne, un accès est ouvert à tous (sur demande). Il permet d’expérimenter les principales fonctionnalités de l’outil.

Bien que conçu pour documenter les ressources produites au sein du laboratoire MAP-Gamsau (Groupe de recherche pour l’application des méthodes scientifiques à l’architecture et à l’urbanisme), spécialisé dans le domaine du patrimoine architectural, ce système peut s’appliquer aux résultats de recherche produits dans le champ des sciences historiques et patrimoniales au sens large. En ce sens, le système a été amendé par un jeu d'activités liées au domaine de l'archéologie (fouilles archéologiques) en collaboration avec le Laboratoire Archéologie et Territoires (LAT) de l’unité Cités, Territoires, Environnement et Sociétés (CITERES, UMR7324, CNRS / Université de Tours).

Comment le système d’information MEMORIA fonctionne-t-il ?

Chaque utilisateur peut naviguer librement en mode recherche et consulter les éléments décrits dans le système. Une fois connecté, l’utilisateur peut alimenter le système avec de nouveaux contenus : ajouter ou modifier les résultats de recherche et documenter leurs processus de production. Chaque utilisateur peut modifier uniquement les contenus dont il est l’auteur.

Il existe également un mode d’analyse qui permet d’afficher des réponses visuelles à des questions plus générales, comme par exemple : De quelle manière le profil d’activité d'un individu a-t-il évolué au fil du temps ? Quelles sont les tâches assignées à un individu au sein d’un projet ?

Description d’un résultat de recherche

Il existe trois types de résultats de recherche : l’output, qui est un résultat en soi (données, résultats d’analyse, hypothèses…), la composition et la publication, qui sont considérées comme des produits de diffusion qui réorganisent, commentent et mobilisent les connaissances et informations amenées par les résultats.

L’output est le composant central du système. Il est décrit par un ensemble de métadonnées descriptives permettant de détailler le contenant (titre, auteur, date de production…) et le contenu (objet d’étude, couverture temporelle d’analyse…) de la ressource produite, qu’elle soit numérique ou physique. Les métadonnées associées varient en fonction du type de résultats.

Un exemple de résultat de recherche (output), produit dans le cadre du projet de recherche ANR SESAMES par le laboratoire MAP et l’unité Perception, Représentations, Image, Son, Musique (PRISM, UMR7061, CNRS / AMU), est constitué de deux collections d’enregistrements de fonds d’air (extérieur et intérieur) acquis pendant la campagne d’étude de quinze chapelles rurales en région PACA (2019-2020).

Ces « fonds d’air » sont des pistes sonores témoignant de la nature des « sons » d’ambiance (anthropiques ou non) entendus dans chacun des sites étudiés. Parmi les métadonnées à décrire dans cet exemple, on retrouve les instruments utilisés pour effectuer l’enregistrement, les formats de fichiers obtenus, et les logiciels employés pour parvenir au résultat final.

Fig1
Description d’un résultat de recherche (output) exportable en format PDF — collection de fonds d’air extérieurs— produit dans le cadre du projet SESAMES  (capture d’écran du 29 septembre 2022). 

Documentation d’un processus de recherche

Afin de documenter la manière dont un résultat a été produit, l’utilisateur se réfère à plus de 300 activités qui lui sont proposées via l’interface MEMORIA. Chaque activité est définie avec un exemple, et représentée visuellement par un pictogramme unique.

Ces activités sont réparties en cinq groupes, correspondant à différentes phases d’un processus de recherche, identifiées chacune par une couleur :

  • acquisition des données (data collection and acquisition) ;
  • filtrage et traitement des données (data filtering and treatment) ;
  • analyse de données (data analysis) ;
  • protocoles d’exploitation (added value procedural activities) ;
  • finalisation (finalisation).
Fig2
Différents groupes d’activités proposés dans le SI MEMORIA. L’ensemble des activités présentes dans le système ont été publiées en mai 2022 : Dudek I., Blaise J-Y 2022, MEMORIA. Nomenclature des activités,Prototype de recherche exploratoire porté par le laboratoire MAP (Modèles et Simulations pour l’Architecture et le Patrimoine), 334 pages.

À l’intérieur de chaque groupe, les activités sont organisées de manière hiérarchique et présentées sous la forme d’une « roue d’activités ».

Figure 3
Partie d’arborescence des activités proposées dans le groupe d’acquisition de données (field acquisition), branche ‘information d’origine humaine’ (human-source information) (capture d’écran du 20 septembre 2022).

L’utilisateur choisit les activités concernant le processus qu’il souhaite décrire, puis il les organise dans un graphe représentant l’ordre dans lequel ces activités sont réalisées, tout en indiquant non seulement leur simultanéité, mais aussi si ces activités sont répétées ou réitérées, etc.

Les processus permettent de garder trace du cadre institutionnel dans lequel les travaux se sont déroulés (organisations, projets, personnel employé, etc.), des sources primaires utilisées en phase d’analyse, ou encore des techniques et outils utilisés pour produire les ressources numériques.

Fig4
Visualisation d’un processus de recherche (process) sous la forme d’un graphe, illustrant le protocole d’acquisition de fonds d’air extérieur dans le cadre du projet ANR SESAMES (capture d’écran du 29 septembre 2022).

Pour documenter le protocole d’acquisition de fonds d’air extérieur dans le cadre du projet ANR SESAMES, les différentes activités réalisées sont retracées dans l’ordre : impression des plans de l’édifice (produites dans un processus précédent), observation sur site et sélection d’un emplacement pour l’enregistrement,  enregistrement audio lui-même, vérification des données, transcription de la position de l’enregistrement audio (sur un plan), sauvegarde et stockage de ces documents (plan et sons).

Le soulignement des activités indique que cette séquence a été répétée pour chacun des édifices étudiés.

Ce protocole s’appuie sur un travail préparatoire (plans des lieux) considéré comme « processus précédent » (symbolisé sur le graphe par la flèche pointant vers la gauche).

Quelle est l’ambition du système d’information MEMORIA ?

L’ambition du système d’information MEMORIA n’est pas d’archiver et de sauvegarder des fichiers contenant des résultats (enjeu de l’archivage à long terme), mais d’identifier, de structurer et de pérenniser des informations sur le contexte de création de ces résultats.

La structuration et la documentation des protocoles de recherche visent à assurer une meilleure compréhension de la production scientifique ainsi que la vérifiabilité, et la réplicabilité des procédures.

L'ambition ultime d'un système est de permettre l’analyse de l’évolution des méthodes de travail au cours du temps.

Regarder la vidéo

Contact

Iwona Dudek
Modèles et Simulation pour l’Architecture et le Patrimoine
Ariane Néroulidis
Modèles et Simulation pour l’Architecture et le Patrimoine