Sarah Wooders questiona resultados 'SOTA' em memória publicados para o MemGPT sem detalhes metodológicos claros.
O benchmark de memória foi facilmente superado com simples ferramentas de sistema de ficheiros, sugerindo falta de validade do teste.
A ausência de revisão por pares no arXiv facilita a publicação de resultados de pesquisa possivelmente enganosos para fins de marketing.
Get notified when new stories are published for "Hacker News 🇵🇹 Português"