CybergeoNetworks2 : une intelligence artificielle d'exploration documentaire au service de l'édition scientifique en sciences humaines et sociales

La Lettre Humanités numériques

#OUTILS DE LA RECHERCHE

Nativement numérique et en accès ouvert, la revue Cybergeo : revue européenne de géographie publie dans toutes les langues européennes depuis 1996, date de sa création. 

La numérisation des publications, dans laquelle Cybergeo a joué un rôle pionnier, a facilité la prolifération des supports de diffusion scientifique avec pour conséquence qu'il est devenu très difficile de maîtriser la connaissance des références, et cela même dans le champ d’une spécialisation relativement étroite. Avec le développement de l’intelligence artificielle, de nouveaux outils proposent des représentations de corpus scientifiques. Ces outils standards, très majoritairement pilotés en fonction des intérêts des entreprises internationales ou des réseaux sociaux qui les produisent, risquent de faire perdre aux chercheurs et chercheuses francophones la maîtrise des catégories scientifiques qu’ils définissent eux-mêmes dans leurs métadonnées. Plus encore, les catégorisations qui leurs sont suggérées par les grands éditeurs et les réseaux sociaux commerciaux tendent à dominer la mise sur agenda des recherches en cours et futures.

À l’occasion du colloque du 26 mai 2016 organisé pour la célébration de ses vingt ans d’existence, la revue Cybergeo avait présenté une application inédite d’analyses géographiques, statistiques et sémantiques des données extraites de son corpus (plein texte et métadonnées) et des données en ligne associées à la revue entre 1996 et 2015 (moteurs de recherche, tweets, citations et publications). Quatre jeunes chercheurs et chercheuse — Pierre-Olivier Chasset, Hadrien Commenges, Clémentine Cottineau, Juste Raimbault — et des membres du laboratoire Géographie-cités (UMR8504, CNRS / EHESS / Université Paris 1 Panthéon-Sorbonne / Université Paris Cité) ont alors réalisé un système original de navigation dans la bibliographie, les mots-clés, les contenus des articles, les références citées et citantes, et même les citées des citantes. Ce système permet d’établir librement des analyses cartographiques et sémantiques et de trouver des chemins parmi de multiples références. Composé de quatre modules, le site CybergeoNetworks était né1..

Dix ans plus tard, considérant qu'il était urgent de doter les revues de sciences humaines et sociales (SHS) d’un outil d’exploration des références bibliographiques utilisant toutes les capacités de l’intelligence artificielle, le projet CybergeoNetworks2 a été soumis à CNRS Sciences humaines & sociales qui lui a apporté son soutien en finançant un ingénieur de recherche pour une durée de 12 à 18 mois. L'intérêt pour l'institution est qu'au-delà de Cybergeo, l'objectif est de fournir une analyse qualitative de la publication en SHS via une application d’exploration bibliographique supervisée par les pairs. Plus précisément, il s’agit de produire une IA qui permette de situer les articles dans un ensemble pertinent de publications internationales à partir des articles qu’ils citent et des citations de ces articles sur le web. Désormais indispensable à l'aide à l’écriture pour les auteurs d’articles (notamment pour rédiger un état de la question) et à la mise en contexte des articles reçus pour les évaluateurs (positionnement dans les rubriques ; choix des lecteurs à solliciter ; enrichissement des suggestions d’amélioration par les lecteurs), cet assistant a vocation à être partagé avec d’autres revues. Les analyses géographiques et thématiques produites sont également susceptibles d'accompagner les prises de décision des comités de rédaction, des pôles éditoriaux et des établissements publics.

Le partenariat de CybergeoNetworks2 avec l'Institut des Systèmes Complexes de Paris Île-de-France (ISC-PIF, UAR3611, CNRS) amorce une étape très importante dans le développement de ce nouvel outil. Avec CybergeoNetworks2, CybergeoNetworks est intégré dans l’application Gargantextun logiciel libre pour l’analyse de grands corpus numériques développé par l’équipe Digital Humanities de l'ISC-PIF en partenariat avec plusieurs institutions. Gargantext combine une méthode avancée de l’exploration de texte, l’analyse de réseau et la visualisation interactive pour fournir de nouvelles formes d’interactions avec une grande diversité de corpus. Ce logiciel permet aussi des explorations très utiles de l’évolution des concepts scientifiques et de leurs engendrements mutuels.

Avec Gargantextl’ISC-PIF apporte une vision future extrêmement pertinente pour l’exploration et la gestion des corpus de connaissances en SHS, dont les trajectoires et les durées de vie diffèrent assez largement de celles des sciences de la matière ou de la vie. De plus, ce laboratoire assure une maintenance durable pour les applications innovantes qu’il crée, ainsi qu’un suivi régulier de leur impact. Ses compétences et ses moyens de calcul sont un apport essentiel à la poursuite de l’innovation en science ouverte qui reste un des objectifs importants de la revue Cybergeo.

Tout en utilisant les fonctionnalités existantes de Gargantext, la nouvelle application CybergeoNetworks2 reprend les principes de CybergeoNetworks pour explorer les contenus éditoriaux et intègre notamment, à côté des « cartes sémantiques » de Gargantext, des représentations cartographiques utiles en SHS, comme les lieux d’activité des chercheurs et chercheuses, les lieux étudiés dans les articles, les liens entre ces localisations, les thématiques et concepts émergents.

Convaincu de l'intérêt d'un tel assistant pour la rédaction, l'évaluation des soumissions par les pairs et la publication scientifique, l’ISC-PIF soutient ce projet porté par Cybergeo. Outre l’apport de sa géosémantique, de cartes géomatiques, de principes de géolocalisation des contenus des articles et de leurs auteurs, ce partenariat permettra d'enrichir l’application Gargantext en ajoutant une dimension géographique aux analyses sémantiques et aux graphes de filiation des concepts étudiés, dans leurs relations avec les lieux de la production scientifique. À terme, CybergeoNetworks2 permettra donc à Gargantext d’élargir son environnement par une nouvelle couche de services ouverts à différents types d’utilisateurs, en fédérant des laboratoires et des institutions autour de cette plateforme. La participation à la conception du projet de Juste Raimbault, chercheur à l’Institut national de l’information géographique et forestière (IGN), témoigne par exemple de l’intérêt de cette institution pour cette réalisation.

Visualisation par Gargantext du nombre d'articles traitant du pays publiés dans Cybergeo

L'outil interactif de réalisation de cartes sémantiques et géographiques de la circulation et des réseaux de production des connaissances offre l'avantage de pouvoir s'appliquer à un large domaine des sciences humaines et sociales, en particulier les disciplines concernées par les questions d’organisation spatiale et d’environnement à toutes les échelles territoriales et pour l’ensemble des aires culturelles. CybergeoNetworks2 permettra à terme une exploration interactive et interdisciplinaire des publications scientifiques internationales à partir de catégories évolutives définies par les chercheurs et chercheuses pour la maîtrise de leurs corpus. Les données, codes sources et matériaux associés seront librement accessibles dans la collection Cybergeo Dataverse et mis à disposition de la communauté, pour leur réutilisation. À la croisée de l’intelligence artificielle et des travaux scientifiques sur les corpus de publications, l’application préfigure une nouvelle dimension dans l’auto-analyse des pratiques de recherche, autant d’un point de vue interdisciplinaire qu’à l’international.

Au-delà d’un aspect documentaire, cet outil innovant permet également d’amorcer une réflexion de nature épistémologique. Une visualisation spatiale permet, par exemple, de représenter les groupes de pays les plus proches d’après les thèmes associés à leurs publications dans Cybergeo et, au-delà, les mots choisis pour parler du pays. On pense aussi à l’exploration algorithmique des contenus de publication et des métadonnées qui permet de faire apparaître des communautés thématiques et des concepts en émergence.

Des partenariats sont en cours de négociation pour étendre le projet aux autres revues de SHS. CybergeoNetworks2 pourrait, par exemple, être proposé comme une offre de service supplémentaire par OpenEdition dans le cadre du contrat Freemium. Cela nécessite toutefois des évolutions dans le traitement des métadonnées — notamment sur la géolocalisation dans l'affiliation des auteurs et dans le référencement de l'index géographique — ainsi qu'un ajustement de la base de données des publications pour des mises à jour régulières de CybergeoNetworks2

Christine Kosmopoulos (dir.), Denise Pumain, Géographie-cités ; Juste Raimbault (dir.), Laboratoire en sciences et technologies de l'information géographique pour la ville intelligente et les territoires durables (Lastig, UGE / IGN-ENSG / EIVP), ISC-PIF, Centre for Advanced Spatial Analysis (University College London), Géographie-cités ; David Chavalarias, Alexandre Delanoë, Yoelis Acourt, ISC-PIF

Contact

Christine Kosmopoulos
Géographie-cités

Notes

 

  1. Kosmopoulos C. 2016, Cybergeo, revue européenne de géographie, une success story de l’accès ouvert, Lettre de l’InSHS n°42 :17-20.