Benchmark Do MemGPT Questionado

Sarah Wooders questiona resultados 'SOTA' em memória publicados para o MemGPT sem detalhes metodológicos claros.

O benchmark de memória foi facilmente superado com simples ferramentas de sistema de ficheiros, sugerindo falta de validade do teste.

A ausência de revisão por pares no arXiv facilita a publicação de resultados de pesquisa possivelmente enganosos para fins de marketing.

Get notified when new stories are published for "Hacker News 🇵🇹 Português"

No Sign-In needed. One-Click Subscribe.

•

Sarah Wooders questiona resultados 'SOTA' em memória publicados para o MemGPT sem detalhes metodológicos claros.

O benchmark de memória foi facilmente superado com simples ferramentas de sistema de ficheiros, sugerindo falta de validade do teste.

A ausência de revisão por pares no arXiv facilita a publicação de resultados de pesquisa possivelmente enganosos para fins de marketing.

Get notified when new stories are published for "Hacker News 🇵🇹 Português"

No Sign-In needed. One-Click Subscribe.