虽然期待已久,虽然最新一周的爆料已经指向“草莓模型”(传说中的OpenAI内部代号)即将发布,但是OpenAI又一次超出大家预期的扔出了一颗“炸弹”,而且第一次不是“期货”。
是的,那个会思考的O1模型来了:
一句话总结是,我们第一次有了大模型的“指挥官”,“规划者”,“思考者”;再加一句是,通向AGI的道路已经越来越清晰。

相比GPT-4o,O1加入了一个“深度思考”的环节,使得大模型在可以代表智力水平的竞赛、代码编写能领域,相对于GPT-4o,有了非常非常质的提升。
这很“炸”,不过受众面很小(一会儿讨论)。
先总结两个初步的体会:
1、这次的模型不是期货,而是直接可用,没有waitlist,用户都可以使用,当然是preview版本;

2、因为有了“思考”,输出的结果与之前相比非常不同,准确率更高,更多的细节,我刚试了一下,在代码领域,几乎可以实现一个大项目的准确规划,具体代码方面,以官网输出为例,显然,新模型可读性更强,更专业,更完整,更准确;

这是一个完全不同的模型,是不叫GPT-5的GPT-5。原因也很简单,其实从GPT-4开始,模型的训练方向就发生了一些变化,最主要的就是,从GPT-3到GPT-4是完全从头来过重新训练的,但是4以后不需要了,预训练部分成为一个可靠的“知识压缩器”,新模型的目标都是如何更有效准确的提取信息,形成答案。
新模型的角色就是“指挥官”,那个大模型出来后,大家公认一直“缺失”的部分。
对市场而言,大家更关心的是,消耗多少算力?会带来多少应用?
首先,算力问题,OpenAI没有直接披露,但是给出了一张很有意思的图:算力与模型能力的“scaling-law”,这意味着,1.scaling-law依然有效;2.从现在可用的preview版本提升到未来会发布的完整版本,需要算力提升可能约为50倍(提供的对数坐标轴大概率是以2为底的),从目前推理性能看,preview跟gpt-4o的速度差不多;

其次,应用落地问题。我一直认为“思考能力强”的模型,正如OpenAI自己介绍的一样,面向的对象是科研,程序开发,数学以及相关领域,其实,受众面很小,但是请原谅关于这个问题在公众号的场合不能再深入了。
补充:
对于很多模型深度应用者而言,O1的出现,是最后一块拼图,在多模型的融合中,我们终于有了“指挥官”角色,当然,经过很长一段时间的“混乱”,OpenAI这次似乎把模型定位讲清楚了,人类的“辅助”,管家,这条安全的“红线”对未来其实意义重大;
这个模型是有门槛的,算力自然是一方面,但是最重要的是“生成数据”的能力;
还是那个越来越清晰的观点,其实从更早的时间开始,大模型,已经从“硬件”走向了“软件”,只是,“软件”的内涵要大的多,难的多。