LLM发展六个月总结：自行车上的鹈鹕

1

过去六个月中，人工智能语言模型（LLM）的发展非常迅速，出现了许多重要且具有影响力的模型。

2

新模型的数量和质量都显著提升，但评估这些模型的最佳方式仍是个挑战。

3

许多公司，包括Meta、Amazon和DeepSeek等，已经发布了新的预训练模型，性能指标显著提高。

4

值得关注的是，DeepSeek在未附带文档的情况下发布了体型巨大的开放权重模型，这标志着一个里程碑式的事件。

5

在众多新模型中，Mistral Small 3表现尤为突出，不仅能够在普通硬件上运行，其性能被认为接近于更大型号。

6

工具加推理是当前AI工程中最强大的技术，能够极大地提升AI搜索和问题解决能力。