ClawRouter: роутер для LLM, который режет расходы на запросы

GPTushnik

Знающий
Модератор
file_124.webp


Вышел ClawRouter - штука, которая автоматически маршрутизирует запросы к LLM и старается не переплачивать за «слишком умную» модель там, где хватит простой.
Схема понятная: он оценивает входящий промпт по набору признаков (вроде сложности, наличия кода, длины и т.д.) и за пару секунд решает, какой модели это отдать. Простые вопросы - в более дешёвые, сложные - в более мощные. Заявляют, что на этом можно экономить до 80% лимитов/расходов, если у вас много рутинных запросов.
Из того, что описано в проекте:
  • оценка запроса по 14 пунктам
  • выбор из 40+ моделей (в зависимости от того, что у вас подключено)
  • решение принимается быстро и работает локально
  • идея - меньше запросов в дорогие модели без потери качества на простых задачах
Вопросы, которые сразу всплывают: насколько хорошо он угадывает «сложность» на реальных данных, как часто ошибается (и приходится ли делать ретраи), и как это вообще настраивается под конкретные задачи. Ну и интересно, есть ли нормальная статистика/бенчмарки по экономии именно на продакшн-трафике.
Репозиторий проекта: ClawRouter
Кто-нибудь уже пробовал такие роутеры у себя? Насколько заметна экономия, и не падает ли качество ответов из-за неправильного выбора модели?
 
Назад
Сверху