Sep 3, 2025

“草莓”来了，那个期盼已久的“指挥官”

中文 (Chinese) English

虽然期待已久，虽然最新一周的爆料已经指向“草莓模型”（传说中的OpenAI内部代号）即将发布，但是OpenAI又一次超出大家预期的扔出了一颗“炸弹”，而且第一次不是“期货”。

是的，那个会思考的O1模型来了：

一句话总结是，我们第一次有了大模型的“指挥官”，“规划者”，“思考者”；再加一句是，通向AGI的道路已经越来越清晰。

相比GPT-4o，O1加入了一个“深度思考”的环节，使得大模型在可以代表智力水平的竞赛、代码编写能领域，相对于GPT-4o，有了非常非常质的提升。

这很“炸”，不过受众面很小（一会儿讨论）。

先总结两个初步的体会：

1、这次的模型不是期货，而是直接可用，没有waitlist，用户都可以使用，当然是preview版本；

2、因为有了“思考”，输出的结果与之前相比非常不同，准确率更高，更多的细节，我刚试了一下，在代码领域，几乎可以实现一个大项目的准确规划，具体代码方面，以官网输出为例，显然，新模型可读性更强，更专业，更完整，更准确；

这是一个完全不同的模型，是不叫GPT-5的GPT-5。原因也很简单，其实从GPT-4开始，模型的训练方向就发生了一些变化，最主要的就是，从GPT-3到GPT-4是完全从头来过重新训练的，但是4以后不需要了，预训练部分成为一个可靠的“知识压缩器”，新模型的目标都是如何更有效准确的提取信息，形成答案。

新模型的角色就是“指挥官”，那个大模型出来后，大家公认一直“缺失”的部分。

对市场而言，大家更关心的是，消耗多少算力？会带来多少应用？

首先，算力问题，OpenAI没有直接披露，但是给出了一张很有意思的图：算力与模型能力的“scaling-law”，这意味着，1.scaling-law依然有效；2.从现在可用的preview版本提升到未来会发布的完整版本，需要算力提升可能约为50倍（提供的对数坐标轴大概率是以2为底的），从目前推理性能看，preview跟gpt-4o的速度差不多；

其次，应用落地问题。我一直认为“思考能力强”的模型，正如OpenAI自己介绍的一样，面向的对象是科研，程序开发，数学以及相关领域，其实，受众面很小，但是请原谅关于这个问题在公众号的场合不能再深入了。

补充：

对于很多模型深度应用者而言，O1的出现，是最后一块拼图，在多模型的融合中，我们终于有了“指挥官”角色，当然，经过很长一段时间的“混乱”，OpenAI这次似乎把模型定位讲清楚了，人类的“辅助”，管家，这条安全的“红线”对未来其实意义重大；

这个模型是有门槛的，算力自然是一方面，但是最重要的是“生成数据”的能力；

还是那个越来越清晰的观点，其实从更早的时间开始，大模型，已经从“硬件”走向了“软件”，只是，“软件”的内涵要大的多，难的多。