Nos últimos seis meses, foram lançados mais de 30 modelos de LLMs significativos, demonstrando a rápida evolução do espaço.
As ferramentas de benchmark tradicionais para avaliar LLMs, como rankings e números, têm perdido confiança. Avaliações pessoais com critérios específicos são sugeridas.
DeepSeek R1 foi lançado com um modelo de pesos abertos e causou um impacto significativo no mercado.
O lançamento do recurso "GPT-4o native multimodal image generation" pela OpenAI atraiu um número massivo de novos usuários.
Os modelos mais recentes têm foco na combinação de ferramentas com raciocínio, oferecendo habilidades avançadas de busca e análise.
Problemas como prompt injection ainda persistem, apresentando riscos significativos quando associadas a acessos de dados privados.
Get notified when new stories are published for "🇵🇹 Hacker News Português"