物理AI是什么形状的?

物理AI是什么形状的?


写下这个标题,可能很多朋友已经知道这篇我想说什么了,是的,一个争论了不短时间的问题:“具身智能”是不是一定要是人形?

起因当然是因为CES上如预期一样成堆冒出来的奇奇怪怪的“机器人”,因为物理AI,但确实也是这一段时间里一直在脑子里转的问题,有了些初步的观点。

但是在我写下这些自己的观点前,还是需要做一些“免责声明”:

无论概念如何定义,我依然极度看好“物理AI”,其实,我应该是市场上最早几个看好具身智能和“机器人”的人;

我的观点只是我作为一个独立的“人”的个体的观察和体会,并没有丰富而坚实的数据和现实证据支撑,既不具备代表性,更谈不上严谨;

资本市场有其自身的运行规律,每个阶段大家关心的核心变量也不同,至少在当前时刻,我的观点肯定跟“T链订单”等核心变量没什么关联;

大概可以写我的“快速观点”了:

直觉上,一个开始“像人”的机器人,或者说机器人的“ChatGPT”时刻到来至少还需要五年时间;经过一些粗略的计算和思考后,将这个答案修正到,至少,十年;

从“想象力”而言,物理AI或者说具身智能必须是“人形”的,否则市场价值可能只有十分之一不到,人类世界发展到现在,值得“All-in”的只有“造人”或者说“造神”了,极少人会高调宣传“我们只需要工具”的,尽管,事实上,我们想要的,只是“工具”;

越来越多人已经很清晰的看到了LLM的局限性,基于数据压缩或者知识压缩的“表象智能”,就是到不了我们人认为的那种“智能”的,尽管我们对于人的智能是什么其实都说不清楚的;

当然,即使是“人形”,我也坚信,那种智能跟我们人的智能是完全两个空间的存在,物理AI会有自己的答案,当然,现在看起来,最重要的阻碍还是,数据远远不够,我曾经写文章粗略计算过,至少10个数量级以上;

我们生存的物理世界,是为人准备的,或者说,是人为了适应自己而改造的,而如果我们真的造出另一种“人”了,那么就会应该有完全不同的形态的:如同汽车干掉马车,电力干掉人力,互联网干掉传统通信。不抬杠,“干掉”从来不是指百分百消灭;

再具体一点,我们日常生活里存在的大量物品,都会讲,符合人体工学原理,它们存在的价值,它们的形态,是“为人所用”,但不代表,我们人有如此灵巧的手,未来的物理AI就需要“灵巧手”,这些也许都是过渡形态;

于是,这指向了最后一个问题,关于复杂度和进步速度的问题,如果复杂度过高,进步速度不够,过渡形态就会持续更长时间,也许最终就变成了“存在即合理”;

我越来越倾向于:复杂度比我们预期的显著高,而且很可能随着我们解决越来越多的问题,待解决的难题也会更多,这符合过去几百年现代科技进步的基本事实;

那么,如果过渡形态是长期合理的,我会有一些“不严谨”的推论:

我们离适合多场景的“人形机器人”依然很远很远,现实的选择就是特定场景的“机器”;

作为国人,大概已经很清楚,高度发达的国内制造业已经将“纯制造成本”(去掉材料,能源等)压缩到非常极限的位置了,这里面其实留给“机器人”的空间很小了,这个结论也是最早讨论“具身智能”时最大的质疑点;

想象空间很多都在生活场景,但是,生活场景的复杂度极高,而且需要应对非常多的corner case,其实,对“智能”的要求是很高的,即使是表象智能,我们依然缺少至少十个数量级以上的数据,有些数据可以通过所谓模拟,生成数据去解决,但绝大多数不能,因为如果可以的话,我们大概已经达到智能驾驶的L5了;

生活场景里的“机器人”与智能驾驶的车有两个最显著的区别:驾驶本质上还是一个相对封闭的场景,目标函数是确定的,遇到的每一个问题都有“最优解”,这条道路在数理逻辑上是不存在明显的障碍的;从更早时间开始卖出去的每一辆车是有成本承担者的,消费者本来就需要车,承担了所有成本,还能通过自己日常的驾驶为车厂提供足够多的数据,这个飞轮早就转起来了,现在是加速突破的时刻,生活场景里的“机器人”呢?

过渡形态是什么?我有一些想法,但是不敢在公开场合里过度讨论,也许只能点到为止:在同样技术可靠度的标准下,我们是给各种门植入非常便宜的自动控制模块更容易,成本更低,还是教会“机器人”处理各种“门把手”更容易,成本更低?

我特别喜欢去年下半年开始一直回荡在自己大脑里的一句话:这个世界,终究是物理的。我也特别喜欢自己二十年前翻开《经济学原理》教科书时的第一感觉:这不就是“普通物理”吗?

当然,也许加上后半句会更完整一点:不具备“预测性”的那种。

但也恰恰是这种“后验性”,可能反而对人类社会有更多的价值,因为这个世界,毕竟是“人”的,我们逃不脱那只“隐形的手”。

← Back to Blog