AI-Agenten zeigen einen konstanten Ausfallrate, die zu einer Exponentialverteilung der Erfolgschancen bei längeren Aufgaben führt.
Der Fortschritt der KI-Agenten wird anhand von Aufgabenlängen gemessen, bei denen sie eine bestimmte Erfolgsrate erzielen.
Die Daten zeigen, dass sich die Aufgabenlänge, die AI-Agenten bearbeiten können, alle 7 Monate verdoppelt.
Die Erfolgsratenmodelle lassen Rückschlüsse auf zugrunde liegende Mechanismen zu, wie die Unfähigkeit von KI-Agenten, frühere Fehler in langen Aufgaben zu korrigieren.
Der Vergleich von Überlebenskurven zwischen menschlicher Leistung und der von AI-Agenten deutet auf unterschiedliche Muster der Erfolgsrate bei zunehmender Aufgabenlänge hin.
Get notified when new stories are published for "🇩🇪 Hacker News Deutsch"