过去六个月中,人工智能语言模型(LLM)的发展非常迅速,出现了许多重要且具有影响力的模型。
新模型的数量和质量都显著提升,但评估这些模型的最佳方式仍是个挑战。
许多公司,包括Meta、Amazon和DeepSeek等,已经发布了新的预训练模型,性能指标显著提高。
值得关注的是,DeepSeek在未附带文档的情况下发布了体型巨大的开放权重模型,这标志着一个里程碑式的事件。
在众多新模型中,Mistral Small 3表现尤为突出,不仅能够在普通硬件上运行,其性能被认为接近于更大型号。
工具加推理是当前AI工程中最强大的技术,能够极大地提升AI搜索和问题解决能力。
Get notified when new stories are published for "🇨🇳 Hacker News 简体中文"