github.com via Hacker News June 26th 2026

Workweave Router : proxy de routage IA multi-modèles sous 50 ms

coding tools agents inference model-routing developer-tools inference-optimization

TL;DR

Workweave Router redistribue chaque requête vers le modèle optimal en moins de 50 ms, via un simple changement d'endpoint.
L'outil s'intègre à Claude Code, Codex CLI, opencode et Cursor (bêta anticipée) sans modifier le code applicatif.
Le projet revendique une réduction des coûts d'inférence de 40 à 70 %, distribué sous Elastic License v2.

Trouver le bon modèle pour chaque requête dans un workflow agentique est un problème à la fois simple en théorie et coûteux en pratique. Workweave Router, un proxy open source écrit principalement en Go, tente de résoudre cette friction sans modifier le code applicatif : il suffit de pointer son endpoint vers le router, qui redistribue chaque appel vers le modèle le plus adapté parmi les providers disponibles en moins de 50 millisecondes.

Le mécanisme central repose sur un "cluster scorer" alimenté par un embedder local, que les auteurs décrivent eux-mêmes comme "a tiny on-box embedder, not a vibes-based prompt". Les formats supportés couvrent les APIs Anthropic Messages, OpenAI Chat Completions et Gemini, avec un accès aux modèles open source via OpenRouter, notamment DeepSeek, Qwen, Llama et Mistral. Les clés des providers sont chiffrées localement par défaut, et le projet expose des traces OpenTelemetry consultables dans un dashboard intégré ou transmissibles à Honeycomb, Datadog ou Grafana.

L'installation est conçue pour être rapide : `npx @workweave/router` suffit pour la version hébergée, ou `make full-setup` pour un déploiement local avec Postgres sur le port 8080. Les environnements supportés incluent Claude Code avec des slash commands dédiées, OpenAI Codex CLI, opencode, et Cursor en bêta anticipée. Le dépôt revendique des économies de 40 à 70 % sur les coûts d'inférence "with just an endpoint change".

La nuance honnête est que cette fourchette est une affirmation du projet, non vérifiée par des tiers, et dépend du mix de requêtes et des modèles disponibles selon chaque configuration. La licence retenue, l'Elastic License v2, n'est pas une licence open source au sens OSI et restreint la redistribution en tant que service géré, ce que les équipes en contexte SaaS devraient vérifier avant adoption. L'intégration Cursor reste en bêta anticipée.

Pour les développeurs déjà dans l'écosystème Claude Code ou Codex, le seuil d'entrée est très bas. Ce que la source ne donne pas, c'est une métrique de précision du routage en conditions réelles, ni le détail des cas où le scorer se trompe. C'est ce retour d'expérience communautaire, plus que les chiffres avancés, qui déterminera si l'outil tient sa promesse en production.

Article original publié par github.com

Lire l'article original →

Titre original : Workweave Router : outil open source de routage intelligent de modèles IA directement dans Claude, Codex et Cursor