arxiv.org détecté sur le web

Nina Begus veut appliquer la littérature mondiale aux LLM

ai ethics generative ai ai-business

TL;DR

  • Dans un preprint mis en ligne le 2 juillet 2026, Nina Begus qualifie les LLM de « rencontre culturelle massive, automatisée et monolingue ».
  • L'essai, à paraître dans MFS Modern Fiction Studies en 2027, propose un cadre en couches articulé autour de la macrostructure, de la circulation et de l'intraduisibilité.
  • Begus mobilise lecture comparée, narratologie, poétique, théorie critique, littérature mondiale et traductologie comme outils « indispensables » pour bâtir une IA culturellement lettrée.

Un preprint mis en ligne le 2 juillet 2026 sur arxiv par Nina Begus prend un angle inhabituel sur les grands modèles de langage : les traiter comme un objet de littérature comparée. L'essai, intitulé « World Wide Models: Literary Tools for Cultural AI » et annoncé pour MFS Modern Fiction Studies en 2027, part d'un constat resserré : les LLM mettent en scène « une nouvelle forme de rencontre culturelle massive, automatisée et monolingue ».

Le geste consiste à mobiliser l'outillage des études littéraires — lecture comparée, analyse narratologique et poétique, théorie critique, littérature mondiale, traduction — pour informer la conception des modèles textuels. Ces outils, écrit Begus, sont désormais « indispensables pour bâtir une IA culturellement lettrée ». Le cadre proposé est présenté en couches et s'organise autour de trois notions empruntées aux approches de la littérature mondiale : macrostructure, circulation et intraduisibilité.

L'intérêt du déplacement est de connecter, selon les termes de l'autrice, « les débats actuels en théorie critique avec le monolinguisme structurel » des modèles, et d'appliquer les approches de littérature mondiale à la « textualité globale » de l'IA. Autrement dit, la question du pluralisme linguistique et culturel des LLM n'est plus posée seulement comme un problème de biais à corriger en aval, mais comme une propriété des modèles textuels eux-mêmes.

Le caveat honnête, c'est que l'abstract ne dit pas comment ces trois couches se traduiraient en choix de corpus, en fonctions de perte ou en protocoles d'évaluation. Il s'agit d'un essai théorique promis à une revue de sciences humaines, pas d'une recette d'ingénierie, et l'abstract ne précise ni les langues ni les traditions littéraires prises comme cas d'étude. Pour qui construit ou évalue des modèles multilingues, la piste vaut néanmoins la lecture complète : elle propose un vocabulaire partagé entre comparatistes et chercheurs en IA, à un moment où la conversation sur le biais culturel des LLM tourne surtout autour des benchmarks anglophones.

Shared on Bluesky by 3 AI experts