Avengers-Pro instrada dinamicamente le query su modelli LLM con diversa capacità ed efficienza in base a un punteggio di performance-efficienza.
Il framework supera del 7% l'accuratezza del miglior modello singolo (GPT-5-medium) variando il parametro di compromesso performance-efficienza.
Avengers-Pro raggiunge la stessa accuratezza del modello più performante con il 27% di costi in meno.
Con un risparmio del 63% sui costi, ottiene circa il 90% delle prestazioni del miglior modello.
Fornisce un fronte di Pareto ottimale, massimizzando l'accuratezza per ogni livello di costo e minimizzando il costo per ogni livello di accuratezza.
Get notified when new stories are published for "Hacker News 🇮🇹 Italiano"