Simon Willison laisse Fable choisir son sous-modèle par tâche
TL;DR
- Simon Willison rapporte un conseil de Jesse Vincent : demander à Fable d'utiliser son jugement pour déléguer les tâches simples à des sous-agents moins chers.
- L'instruction exacte à Claude Code : « For all coding tasks use your judgement to decide an appropriate lower power model and run that in a subagent ».
- Cat Wu et Thariq Shihipar, équipe Claude Code, ont conseillé lors d'un Fireside Chat à l'AI Engineer World's Fair de laisser Fable arbitrer.
Le tip vient d'un Fireside Chat qu'a animé Simon Willison à l'AI Engineer World's Fair avec Cat Wu et Thariq Shihipar, de l'équipe Claude Code, et il tient en une idée simple. Plutôt que de dicter à Fable comment travailler, laissez-le arbitrer. L'exemple donné sur scène était celui des tests. Au lieu d'écrire une règle du type « n'exécute pas les tests pour les petites modifications de design ou de copy », il vaut mieux confier à Fable la décision de lancer ou non un test.
Willison a poussé le principe plus loin en s'inspirant d'un conseil de Jesse Vincent sur la maîtrise des coûts : demander à Fable de choisir lui-même le modèle sous-jacent à utiliser pour chaque tâche. Son instruction exacte à Claude Code, telle qu'il la publie sur son blog, est « For all coding tasks use your judgement to decide an appropriate lower power model and run that in a subagent ». Le fichier de mémoire créé par l'outil résume la logique en une formule coût/efficacité : l'implémentation a rarement besoin du modèle haut de gamme, tandis que le jugement, la revue et la synthèse restent dans la boucle principale. En pratique, Sonnet prend l'implémentation substantielle, Haiku s'occupe des retouches mécaniques, Fable garde la conception et la révision.
Le résultat que revendique Willison est double : un débit productif accru, et une consommation de tokens Fable qui ralentit nettement. Prenez la précision comme rapportée, pas comme démontrée. C'est le retour d'un seul praticien sur ses propres flux, pas un benchmark reproductible, et le billet ne quantifie ni le gain de productivité ni l'économie de tokens.
Ce qui manque au billet, c'est la mesure : pas de chiffre d'économie publié, pas de comparaison avant/après sur un même repo, pas de discussion des cas où un sous-agent Haiku se plante et coûte plus cher en corrections qu'il n'aurait coûté en Fable directement. Pour un praticien, la question intéressante est moins « faut-il le faire » que « à partir de quel volume de tâches triviales la délégation par jugement devient plus rentable qu'un routing manuel ». Si l'approche tient, c'est aussi un signal pour les équipes qui construisent des pipelines multi-modèles maison : le routing par jugement du modèle principal pourrait rendre une partie de leur plomberie superflue.
Shared on Bluesky by 3 AI experts
-
Simon Willison @simon.fedi.simonwillison.net.ap.brid.gy: More notes on my blog: https://t.co/R2tCp4ThFH →
Article original publié par simonwillison.net
Lire l'article original →Titre original : Simon Willison : « Laissez Fable juger » — l'essai qui secoue la communauté agentique sur la délégation aux sous-agents low-cost