GPT-4 Turbo paraît plus authentique que 112 figures publiques UK
TL;DR
- Une étude publiée le 1er juillet 2026 dans PLOS One a fait imiter 112 personnalités britanniques par GPT-4 Turbo à partir des archives de Question Time.
- Sur 948 Britanniques évaluateurs, la majorité juge les réponses IA plus cohérentes et pertinentes, et plus de la moitié les trouvent plus authentiques que les vraies.
- Steffen Herbold (Université de Passau) alerte sur un besoin urgent d'informer le public des dommages potentiels pour la société.
Une étude publiée le 1er juillet 2026 dans PLOS One arrive à une conclusion inconfortable: quand on demande à GPT-4 Turbo d'imiter des personnalités publiques britanniques, ses réponses sont jugées plus authentiques que les vraies. Comme le rapporte 404 Media, Steffen Herbold et son équipe de l'Université de Passau ont entraîné le modèle sur les interventions de 112 invités de Question Time, l'émission de débat de la BBC, en complétant avec des biographies Wikipédia. Ils ont ensuite fait évaluer par 948 Britanniques des réponses réelles et des réponses générées, sur trois axes: authenticité, cohérence, pertinence.
Sur les trois axes, l'IA l'emporte. Une nette majorité de participants trouve les réponses artificielles plus cohérentes et plus pertinentes, et plus de la moitié les jugent aussi plus authentiques que celles prononcées par les personnes elles-mêmes. Les auteurs écrivent que « LLM-generated, impersonated content is judged as more authentic, coherent, and relevant than the actual debate responses ». Herbold lui-même dit ne pas s'y être attendu, pour des figures aussi médiatisées on aurait pu croire leur style difficile à contrefaire.
Ce que ça change, si on prend le résultat au sérieux: la ligne de défense implicite du grand public face aux deepfakes textuels, « on sentira que ça sonne faux », s'effondre. Les 112 profils couverts par l'étude ne sont pas seulement des politiques, on y trouve aussi des journalistes, des médecins, des chefs d'entreprise et des écrivains, ce qui étend la surface d'attaque bien au-delà du cycle électoral. Herbold parle d'un « dire need to inform the general public of the potential harm this can have on society », ce qui, en substance, vaut appel aux plateformes et aux régulateurs.
Le caveat honnête: l'étude porte sur un seul modèle (GPT-4 Turbo), un seul format (des réponses courtes de plateau télé), un seul pays, et elle mesure une perception de lecteurs, pas la performance de détecteurs automatiques. Le rapport ne dit pas si un classificateur entraîné aurait toujours repéré les productions synthétiques, ni comment les résultats varient d'un profil à l'autre. Ce qui reste à surveiller, ce sont les benchmarks de détection et les obligations de traçabilité qui vont sortir de ce genre de travaux, plus que le score d'authenticité lui-même.
Shared on Bluesky by 3 AI experts
-
Researchers discovered that people found AI impersonators to be more authentic, coherent, and relevant than the real politicians, raising alarm bells around the potential for public deception.
View on Bluesky →
Article original publié par 404media.co
Lire l'article original →Titre original : Étude PLOS One : GPT-4 Turbo impersonne 112 personnalités britanniques et paraît plus authentique que les vrais élus