404media.co détecté sur le web

OpenAI, Nvidia et GitHub adoptent Caveman pour les tokens

TL;DR

  • Caveman, skill créé par Julius Brussee début avril, réduit la sortie en tokens de Claude Code d'environ 65 à 75 % selon son auteur.
  • Des développeurs chez OpenAI, Nvidia et GitHub l'utilisent ; Shayne Sweeney, senior engineering director chez OpenAI, a contribué le support de Codex.
  • Legrand impose la « caveman skill » en interne, pendant qu'Uber a épuisé son budget IA en quatre mois et que GitHub facture au token depuis avril.

Un petit skill open source publié début avril pour Claude Code, baptisé Caveman, en dit plus long sur l'état du marché de l'IA en entreprise que sur l'outil lui-même. Selon 404 Media, des développeurs chez OpenAI, Nvidia et GitHub l'ont adopté pour forcer leurs assistants à arrêter les politesses et à répondre comme des hommes des cavernes.

Le principe est volontairement rustique. Caveman demande au modèle d'abandonner transitions, hedgings et ton de chatbot poli pour ne renvoyer que l'essentiel. Son auteur Julius Brussee revendique une réduction d'environ 65 à 75 % des tokens de sortie par rapport au mode verbeux par défaut, et décrit un outil qui fait « parler le modèle moins comme un chatbot poli et plus comme un outil concis ». Shayne Sweeney, senior engineering director chez OpenAI, est même allé jusqu'à contribuer du code pour ajouter le support de Codex au plugin. Plusieurs niveaux d'intensité coexistent, de lite à ultra, jusqu'à un mode Wenyan en chinois classique.

Si un gadget pareil intéresse des grands comptes, c'est à cause de ce qui se passe autour. Le même reportage rappelle qu'Uber a cramé l'ensemble de son budget IA en quatre mois, que Walmart a posé des plafonds d'usage et que GitHub est passé en avril à une facturation au token. Chez Legrand, une note interne demande aux salariés d'utiliser explicitement la « caveman skill » pour rester dans les quotas. Accenture évoque de son côté une « tokenpocalypse » alimentée jusqu'aux conversions de PDF en présentations. La facture token est devenue un poste de coût à part entière, y compris chez ceux qui vendent les modèles.

Le revers honnête, c'est que le reportage de 404 Media ne dit pas grand-chose de la qualité du code une fois passé au régime sec, ni du nombre d'utilisateurs réguliers chez OpenAI, Nvidia ou GitHub par-delà l'effet de buzz. Reste un signal difficile à ignorer : quand un directeur d'ingénierie d'OpenAI contribue à un outil dont la fonction est de faire dire moins de choses à son propre modèle, on tient probablement le début d'un mode « terse » qui finira par être natif dans Codex, Cursor ou Copilot, sous la pression directe des acheteurs.

Shared on Bluesky by 4 AI experts