Routing Ottimizzato per LLM Performanti ed Efficienti

Avengers-Pro instrada dinamicamente le query su modelli LLM con diversa capacità ed efficienza in base a un punteggio di performance-efficienza.

Il framework supera del 7% l'accuratezza del miglior modello singolo (GPT-5-medium) variando il parametro di compromesso performance-efficienza.

Avengers-Pro raggiunge la stessa accuratezza del modello più performante con il 27% di costi in meno.

Con un risparmio del 63% sui costi, ottiene circa il 90% delle prestazioni del miglior modello.

Fornisce un fronte di Pareto ottimale, massimizzando l'accuratezza per ogni livello di costo e minimizzando il costo per ogni livello di accuratezza.

Get notified when new stories are published for "Hacker News 🇮🇹 Italiano"

No Sign-In needed. One-Click Subscribe.

•

Hacker News 🇮🇹 Italiano•August 22, 2025 at 03:15 PM

Avengers-Pro instrada dinamicamente le query su modelli LLM con diversa capacità ed efficienza in base a un punteggio di performance-efficienza.

Il framework supera del 7% l'accuratezza del miglior modello singolo (GPT-5-medium) variando il parametro di compromesso performance-efficienza.

Avengers-Pro raggiunge la stessa accuratezza del modello più performante con il 27% di costi in meno.

Con un risparmio del 63% sui costi, ottiene circa il 90% delle prestazioni del miglior modello.

Fornisce un fronte di Pareto ottimale, massimizzando l'accuratezza per ogni livello di costo e minimizzando il costo per ogni livello di accuratezza.

Get notified when new stories are published for "Hacker News 🇮🇹 Italiano"

No Sign-In needed. One-Click Subscribe.