CLI-агент Qodo Command набрал 71,2% на бенчмарке SWE-bench Verified без дообучения и специальных настроек.
SWE-bench Verified проверяет агентов на реальных сложных задачах из GitHub Issue с многофайловыми Python-репозиториями.
Для выполнения тестов Qodo Command использует модель Claude 4 благодаря партнёрству с Anthropic.
Архитектура включает суммирование контекста, планирование выполнения, механизмы повторных попыток и резервные сценарии.
Фреймворк LangGraph обеспечивает модульность, скорость и графовую оркестровку рабочих процессов.
Набор инструментов агента включает работу с файловой системой, Shell, Ripgrep и стратегию последовательного мышления.
Qodo Command поддерживает автоматизацию целостности кода: ревью, генерацию тестов и документации.
Встроенный UI-режим Qodo Merge позволяет интегрированно просматривать и проверять сгенерированный код.
Get notified when new stories are published for "Hacker News 🇷🇺 Русский"