Anthropic redéploie Fable 5 et pose un barème des jailbreaks
TL;DR
- Fable 5 revient le 1er juillet sur Claude Platform, Claude.ai, Claude Code et Claude Cowork, après la levée des contrôles à l'export le 30 juin.
- Les forfaits Pro, Max, Team et certaines offres Enterprise incluent Fable 5 jusqu'à 50 % de l'usage hebdomadaire jusqu'au 7 juillet.
- Avec Amazon, Microsoft, Google et le CAISI, Anthropic propose un barème à quatre axes pour noter la gravité d'un jailbreak.
Trois semaines après avoir été mise à l'arrêt par des contrôles à l'export américains, Fable 5 revient. Anthropic écrit sur son site que le modèle sera de nouveau disponible mondialement à partir du 1er juillet, sur Claude Platform, Claude.ai, Claude Code et Claude Cowork, après que les restrictions ont été levées le 30 juin. Jusqu'au 7 juillet, les forfaits Pro, Max, Team et certaines offres Enterprise l'incluront à hauteur de 50 % de l'usage hebdomadaire, avant de basculer sur un système de crédits.
Le déclencheur, ce sont des chercheurs d'Amazon qui avaient trouvé une technique de contournement permettant à Fable 5 d'identifier des vulnérabilités logicielles. Anthropic affirme désormais que son nouveau classifieur bloque cette technique dans « plus de 99 % des cas », selon une logique de « defense in depth » qui empile plusieurs mécanismes plutôt que d'en isoler un seul. Le Center for AI Standards and Innovation (CAISI), rattaché au Département du Commerce américain, a testé les protections avant et après, et les juge, selon Anthropic, « extraordinarily strong ».
La partie la plus intéressante de l'annonce n'est pas la remise en ligne, mais ce qui l'accompagne. Avec Amazon, Microsoft, Google et d'autres partenaires du Project Glasswing, Anthropic propose un barème commun pour noter la gravité d'un jailbreak sur quatre axes: le gain de capacité par rapport aux outils existants, l'ampleur des tâches offensives rendues possibles, la facilité à le weaponiser, et sa découvrabilité par d'éventuels attaquants. Un vocabulaire partagé entre grands fournisseurs et une agence fédérale, cela change la façon dont un exploit peut être disqualifié ou pris au sérieux.
L'honnête réserve, c'est que le taux de blocage cité reste un chiffre auto-déclaré, que le billet ne détaille pas la vulnérabilité précise trouvée par Amazon, ni comment les quatre critères se combinent en un score, ni ce qui distingue les offres Enterprise éligibles au quota promotionnel. Anthropic reconnaît d'ailleurs qu'« il est probablement impossible de rendre un modèle IA totalement robuste aux jailbreaks ». Reste que si ces critères s'imposent, les équipes sécurité gagneront un langage commun pour trier les incidents, et le CAISI pourrait se consolider en point de passage de fait pour l'évaluation des modèles de frontière.
Shared on Bluesky by 4 AI experts
-
> Fable 5 will be available starting tomorrow, Wednesday, July 1, to users globally on the Claude Platform > Fable 5 will be included for up to 50% of weekly usage limits through July 7, after which it will be available…
View on Bluesky → -
Claude Fable 5 will be available again globally tomorrow. (1/6)
View on Bluesky →
Article original publié par anthropic.com
Lire l'article original →Titre original : Anthropic redéploie Fable 5 dès le 1er juillet et lance avec Amazon, Microsoft et Google un standard de sévérité des jailbreaks IA