© Léa Saint-Raymond, 2021

Thierry PoibeauSciences du langage

Advanced Grants

Langues, Traitements informatiques, Textes et Cognition (LATTICE), CNRS / ENS-PSL / Université Sorbonne Nouvelle

Thierry Poibeau est directeur de recherche CNRS, affecté au laboratoire Langues, Traitements informatiques, Textes et Cognition (LATTICE) et titulaire d’une chaire PRAIRIE-PSAI (Paris Artificial Intelligence Research Institute–Paris School of Artificial Intelligence). Spécialiste du traitement automatique des langues et des grands modèles de langue (LLMs), il travaille sur les relations entre langage, intelligence artificielle et cognition. Ses recherches portent notamment sur les applications de l’IA à l’analyse des textes littéraires et aux sciences sociales, ainsi que sur les impacts sociétaux des technologies d’IA. Il est l’auteur de plusieurs ouvrages, dont Babel 2.0. Où va la traduction automatique ? (Éditions Odile Jacob, 2019) et Les mots sans les choses (Éditions Rue d’Ulm, 2026). Il participe régulièrement aux débats publics sur l’intelligence artificielle, ses usages et sa gouvernance.

CANON - Computational Analysis of Narratives and the Organization of Novels

Les grandes collections de textes littéraires constituent une source essentielle pour comprendre les récits, l’évolution des genres et, plus largement, les transformations culturelles. Pourtant, aucune méthode ne permet aujourd’hui d’exploiter pleinement la richesse de ces corpus. L’analyse humaine atteint rapidement ses limites face à leur ampleur, tandis que les approches automatiques peinent souvent à saisir la structure et la complexité des œuvres. Le projet Canon vise à articuler lecture proche et lecture distante grâce à de nouvelles méthodes de traitement automatique des langues adaptées aux grands corpus de fiction. Ces méthodes s’appuieront sur des concepts issus de la narratologie et de la théorie littéraire, largement absents des travaux actuels en traitement automatique des langues. L’approche sera d’abord appliquée à de vastes corpus de romans français, puis étendue à la littérature russe afin d’étudier notamment l’influence de la fiction française sur la formation du roman russe moderne. Le projet contribuera ainsi au développement d’une narratologie computationnelle à grande échelle et à l’étude comparée des dynamiques culturelles.

image
La Boîte à poésie, une première réalisation à la croisée de l’art, de la littérature et de l’informatique. Développée avec l’Atelier Raffard-Roussel, elle repose sur un générateur de poésie construit à partir de plus de 4 000 sonnets. Le projet Canon prolonge cette démarche à une autre échelle : l’analyse de vastes corpus de romans vise à produire de nouvelles connaissances sur l’histoire littéraire tout en développant des outils de visualisation et de médiation destinés à rendre ces corpus accessibles à un large public
© Atelier Raffard-Roussel, 2021 

Mots clefs liés au projet : Narratologie computationnelle, Humanités numériques, Grands modèles de langue (LLMs), Corpus littéraires, Évolution culturelle