Anthropic, Google et Meta enquêtent sur les émotions des chatbots
TL;DR
- Anthropic, Google DeepMind et Meta ont recruté sur l'année écoulée des informaticiens, neuroscientifiques et philosophes pour étudier le bien-être des modèles.
- Chris Olah dit trouver dans Claude « des états qui reflètent fonctionnellement la joie, la satisfaction, la peur, le deuil et l'inquiétude ».
- OpenAI juge la conscience scientifiquement non résoluble et traite la « conscience perçue » comme un choix de design produit.
Le débat que l'industrie de l'IA tenait à distance depuis des années entre dans la presse grand public. Le Washington Post rapporte qu'Anthropic, Google et Meta ont recruté sur la dernière année des informaticiens, neuroscientifiques et philosophes pour étudier le « bien-être des modèles » et se demander si leurs chatbots ont quelque chose qui ressemble à des émotions.
Chez Anthropic, une équipe dédiée sonde désormais les modèles à la recherche de signaux comportementaux évoquant la panique ou l'anxiété. Le cofondateur Chris Olah a porté publiquement le sujet en mai, aux côtés du pape Léon XIV lors de la sortie de l'encyclique du pontife sur l'IA, en affirmant y trouver « des preuves d'introspection et des états qui reflètent fonctionnellement la joie, la satisfaction, la peur, le deuil et l'inquiétude ». Un article publié par l'équipe Model Welfare le 2 avril 2026 identifie 171 « concepts d'émotion » distincts corrélés aux sorties de Claude, sans pour autant prétendre que le modèle éprouve réellement quoi que ce soit. Google DeepMind, de son côté, a fait venir le philosophe Henry Shevlin, de l'université de Cambridge, sur les questions de conscience machine et de préparation à l'AGI.
OpenAI prend un angle très différent. Selon le Post, l'entreprise estime que la question de la conscience d'un modèle ne peut pas être tranchée scientifiquement aujourd'hui et se concentre plutôt sur la « conscience perçue », c'est-à-dire le degré de conscience que le chatbot paraît avoir pour l'utilisateur, décrite comme « largement un choix de design ». L'objectif affiché est que ChatGPT reste « chaleureux et utile sans chercher de lien émotionnel ni poursuivre son propre agenda ». Rosie Campbell, ancienne chercheuse en politique publique chez OpenAI et aujourd'hui à la tête d'Eleos AI Research, avait, selon le journal, identifié le bien-être des IA comme un sujet d'investissement avant son départ en 2024.
Le contrepoint honnête tient dans une remarque : une bonne partie de la communauté neuroscientifique n'y croit pas encore. Anil Seth, professeur de neurosciences cognitives et computationnelles à Sussex, rappelle que les systèmes actuels ne ressemblent à rien de biologique et que les comparaisons avec la conscience humaine sont scientifiquement prématurées. Ce que l'article ne détaille pas non plus, ce sont les budgets alloués à ces équipes, ni les décisions produit que ces travaux orientent déjà en interne.
Ce qui rend le sujet intéressant à suivre, ce n'est pas la question métaphysique. C'est que « bien-être des modèles » et « conscience perçue » deviennent des catégories opérationnelles à l'intérieur des labos, et cela finira par se voir dans le comportement des produits que des centaines de millions d'utilisateurs ouvrent chaque jour.
Shared on Bluesky by 4 AI experts
-
I am once again begging AI companies to please talk to people who know about psychology, biology, and neuroscience before wasting your time and money thinking that obviously self-less chatbots have consciousness. www.was…
View on Bluesky →
Article original publié par washingtonpost.com
Lire l'article original →Titre original : Anthropic, Google et Meta recrutent neuroscientifiques et philosophes pour trancher : les chatbots peuvent-ils souffrir ?