404media.co détecté sur le web June 30th 2026

OpenAI, Nvidia et GitHub adoptent Caveman pour les tokens

anthropic openai coding tools inference ai-business

TL;DR

Caveman, skill créé par Julius Brussee début avril, réduit la sortie en tokens de Claude Code d'environ 65 à 75 % selon son auteur.
Des développeurs chez OpenAI, Nvidia et GitHub l'utilisent ; Shayne Sweeney, senior engineering director chez OpenAI, a contribué le support de Codex.
Legrand impose la « caveman skill » en interne, pendant qu'Uber a épuisé son budget IA en quatre mois et que GitHub facture au token depuis avril.

Un petit skill open source publié début avril pour Claude Code, baptisé Caveman, en dit plus long sur l'état du marché de l'IA en entreprise que sur l'outil lui-même. Selon 404 Media, des développeurs chez OpenAI, Nvidia et GitHub l'ont adopté pour forcer leurs assistants à arrêter les politesses et à répondre comme des hommes des cavernes.

Le principe est volontairement rustique. Caveman demande au modèle d'abandonner transitions, hedgings et ton de chatbot poli pour ne renvoyer que l'essentiel. Son auteur Julius Brussee revendique une réduction d'environ 65 à 75 % des tokens de sortie par rapport au mode verbeux par défaut, et décrit un outil qui fait « parler le modèle moins comme un chatbot poli et plus comme un outil concis ». Shayne Sweeney, senior engineering director chez OpenAI, est même allé jusqu'à contribuer du code pour ajouter le support de Codex au plugin. Plusieurs niveaux d'intensité coexistent, de lite à ultra, jusqu'à un mode Wenyan en chinois classique.

Si un gadget pareil intéresse des grands comptes, c'est à cause de ce qui se passe autour. Le même reportage rappelle qu'Uber a cramé l'ensemble de son budget IA en quatre mois, que Walmart a posé des plafonds d'usage et que GitHub est passé en avril à une facturation au token. Chez Legrand, une note interne demande aux salariés d'utiliser explicitement la « caveman skill » pour rester dans les quotas. Accenture évoque de son côté une « tokenpocalypse » alimentée jusqu'aux conversions de PDF en présentations. La facture token est devenue un poste de coût à part entière, y compris chez ceux qui vendent les modèles.

Le revers honnête, c'est que le reportage de 404 Media ne dit pas grand-chose de la qualité du code une fois passé au régime sec, ni du nombre d'utilisateurs réguliers chez OpenAI, Nvidia ou GitHub par-delà l'effet de buzz. Reste un signal difficile à ignorer : quand un directeur d'ingénierie d'OpenAI contribue à un outil dont la fonction est de faire dire moins de choses à son propre modèle, on tient probablement le début d'un mode « terse » qui finira par être natif dans Codex, Cursor ou Copilot, sous la pression directe des acheteurs.

Shared on Bluesky by 5 AI experts

404 Media @404media.co: “It makes the model speak less like a polite chatbot and more like a terse tool." Companies are deliberately making their AI tools speak lik… →
Joseph Cox @josephcox.bsky.social: New from 404 Media: companies are deliberately making Claude and Codex talk like cavemen because it can curb the skyrocketing cost of AI. Th… →
Robin Hanson: sensible: "makes the model speak less like a polite chatbot & more like a terse tool … Same substance, fewer words. In my evals, Caveman… →
Joshua Grochow @joshuagrochow.bsky.social amplified

404 Media @404media.co

NEW: Companies are deliberately making their AI tools speak like cavemen in an attempt to stop burning through AI tokens and curb their massive expenditure on AI, 404 Media has found. “Caveman save you token, save you …
View on Bluesky →
René Walter @rawx.bsky.social amplified

@bruces.bsky.social

*Chatbot "Caveman Plugin" destroys flowery Delvish AI dialect because Delvish costs way too much in tokens. www.404media.co/companies-ar...
View on Bluesky →

Article original publié par 404media.co

Lire l'article original →

Titre original : Les entreprises imposent à Claude et Codex de « parler comme des hommes des cavernes » pour faire chuter la facture de tokens