时间飞速流逝,又一年即将过去。然而自从ChatGPT问世后的两年,似乎每一天都充实和充满压力:即使不做完整的统计,仅凭主观感受,都可以很有把握的说出“几乎每一天都有新模型或者新产品的发布”。
上周,我完成了一篇2025年的AI前瞻:
2025年AI前瞻
道明,公众号:道明数字游牧生活
又到了写2025年AI领域前瞻的时刻了,两个关键词,若干个预测,一个潜在风险
主要结论如下图:
有些点已经达成共识,有些点正在显现,有些点还有待观察。
但是对于更为复杂的2025年,可能还是需要换一种维度去讨论一些问题,这些问题更为长期。我能想到的三个问题:1、AI中长期的动力与约束:能源和数据;2、AI大规模应用后带来的变化:效率提升与组织架构变革;3、更智能的未来:产品与“用户体验”。
每一个点的展开可能都需要更多的时间去证实和证伪,下面,仅梳理一些要点。
一、AI中长期的动力与约束:能源和数据
如果我们将明年预训练所需的大型集群的规模设定在单集群10万个英伟达Blackwell的GPU,使用类似于NVL72的密度,简单的数学就是:一个机柜120KW功率,72个GPU,一共需要1389个机柜,167MW功率。算上其他设备,基本就是至少一个200MW发电站的水平,别忘了,还要加上备用电源。即使备用UPS按照“掉电后维持半小时”设计,对于备用发电机和储能储备而言,都是很大的量。更何况,这样的集群数量全球而言应该不是个位数;
很多人都在提Scaling Law失效问题,但是没人可以否认其实背后还是一个算力集群规模和数据规模与质量限制的问题。因为当前还无法实验,所以对于“扩十倍数据量会不会导致Scaling Law失败”这个问题,其实谁都没有确定的答案。问题只是在于,人类高质量的数据短时间内很难扩十倍。生成数据可以用,但是目前的“模型推理成本”还是很高。十倍数据量约100T-200T的Tokens,即使按照10美金百万(M)Tokens计算,生成数据的成本也是数亿美金起步,这还只是文本数据生成,图像数据生成的成本至少高一个数量级(否则sora不会那么吝啬了);
能源和数据的巨大需求不仅在训练阶段,在应用阶段更是如此:新时代的“液体黄金”,这个比喻并不过分;
二、AI大规模应用后带来的变化:效率提升与组织架构变革
越来越多的模型和产品都将重点放在了“编程能力”上:AI挑战2025之一:AI程序员,由bolt.new想到的。所谓的Agent其实也是依赖于“程序生成”能力,程序生成能力是一个非常综合的能力,基础的程序编写能力只是一部分,更重要的是任务理解和建模能力:离开程序能力单纯讲Agent的“理解力”是没有意义的;
通过代码生成,大幅提升各方面的生产效率,是这一代AI发展到目前水平已经可以实现的目标;
在我持续两年的高频交流中,一个观点的变化很有意思:2023年很多人认为这是大变革,2024年却有很大一部分人改变了观点,认为只是“生产力的改变”,而不是“生产关系的变革”。可是,生产力决定生产关系,不是吗?2025年,也许就是我们两年前认为的“变革”的开始;
圣诞前后,美国的大型科技公司又开始了新一轮裁员潮,基础是效率评估,结果是:减少管理岗位;
在我们已经能够看到的AI大规模应用的场景下,纯管理岗位需求就是大幅减少的,这种纯管理岗位并非单纯的“管人”的岗位,还包括一系列的流程管理,资源管理,等等。最重要的,其实就是各种企业存在的一大堆无法从最基础的工作做到结果产出的所谓一线岗位。大企业的组织架构大调整的“窗口期”又一次到来了;
三、产品与“用户体验”
我们需要什么样的C端产品:云端大模型?AI手机?AIPC?AI眼镜和硬件?无人驾驶?机器人?
有没有可能,用户也没想清楚,厂商也没想清楚,我们到底要什么样的“产品”?
不过,大体上,我们都希望AI产品能够满足我们两项基本需求的其中之一:“懒惰天性”,“情感寄托”;
所以,“用户体验”的要求变了:懒惰的极致就是“模型或者机器替我们打工”,我们与机器的交互流程就变得很简单,若干次输入和若干次输出(非常直接,文字,语音,或者图像与视频),互联网的“漏斗模型”逐渐将不复存在;“情感寄托”,预计将建立在足够的个性化上,可是真的会不会长得像科幻片里一样,其实都不知道;
在过去的很长一段时间,很多用户都会先入为主的认为“苹果手机比安卓手机更好用”,但随着时间的推移,也有越来越多的用户认为“安卓更好用”。背后的原因其实就是因为硬件与操作系统越来越标配(比如高通的SoC使得硬件平台标准化并且固定下来)后,软件的优化变得容易;
然而,到了AI产品时代,“用户体验”好的产品将会需要更多的“软件定义硬件”,所以,为什么生态和软硬件一体化能力变得更重要,为什么需要“All-in-One”也在这里,可是这又涉及到一个“反垄断”的问题,有意思;
这一轮AI,我们能想到的一个最重要的终极应用是“人形机器人”,也是最讲“用户体验”的,也许C端的“体验”讲究“个性化智能”,B端的“体验”,可能反其道行之,更低的全生命周期成本;
感觉又回到了一个“原点”,2023年刚开始时候的那个点。兴奋的是,经过两年的“军备竞赛”,我们拥有的模型更多更智能,对未来也似乎看得更清楚一点了。