Qodo Command набрал 71,2% на SWE-bench

1

CLI-агент Qodo Command набрал 71,2% на бенчмарке SWE-bench Verified без дообучения и специальных настроек.

2

SWE-bench Verified проверяет агентов на реальных сложных задачах из GitHub Issue с многофайловыми Python-репозиториями.

3

Для выполнения тестов Qodo Command использует модель Claude 4 благодаря партнёрству с Anthropic.

4

Архитектура включает суммирование контекста, планирование выполнения, механизмы повторных попыток и резервные сценарии.

5

Фреймворк LangGraph обеспечивает модульность, скорость и графовую оркестровку рабочих процессов.

6

Набор инструментов агента включает работу с файловой системой, Shell, Ripgrep и стратегию последовательного мышления.

7

Qodo Command поддерживает автоматизацию целостности кода: ревью, генерацию тестов и документации.

8

Встроенный UI-режим Qodo Merge позволяет интегрированно просматривать и проверять сгенерированный код.