Jan 8, 2026

物理AI是什么形状的？

中文 (Chinese) English

写下这个标题，可能很多朋友已经知道这篇我想说什么了，是的，一个争论了不短时间的问题：“具身智能”是不是一定要是人形？

起因当然是因为CES上如预期一样成堆冒出来的奇奇怪怪的“机器人”，因为物理AI，但确实也是这一段时间里一直在脑子里转的问题，有了些初步的观点。

但是在我写下这些自己的观点前，还是需要做一些“免责声明”：

无论概念如何定义，我依然极度看好“物理AI”，其实，我应该是市场上最早几个看好具身智能和“机器人”的人；

我的观点只是我作为一个独立的“人”的个体的观察和体会，并没有丰富而坚实的数据和现实证据支撑，既不具备代表性，更谈不上严谨；

资本市场有其自身的运行规律，每个阶段大家关心的核心变量也不同，至少在当前时刻，我的观点肯定跟“T链订单”等核心变量没什么关联；

大概可以写我的“快速观点”了：

直觉上，一个开始“像人”的机器人，或者说机器人的“ChatGPT”时刻到来至少还需要五年时间；经过一些粗略的计算和思考后，将这个答案修正到，至少，十年；

从“想象力”而言，物理AI或者说具身智能必须是“人形”的，否则市场价值可能只有十分之一不到，人类世界发展到现在，值得“All-in”的只有“造人”或者说“造神”了，极少人会高调宣传“我们只需要工具”的，尽管，事实上，我们想要的，只是“工具”；

越来越多人已经很清晰的看到了LLM的局限性，基于数据压缩或者知识压缩的“表象智能”，就是到不了我们人认为的那种“智能”的，尽管我们对于人的智能是什么其实都说不清楚的；

当然，即使是“人形”，我也坚信，那种智能跟我们人的智能是完全两个空间的存在，物理AI会有自己的答案，当然，现在看起来，最重要的阻碍还是，数据远远不够，我曾经写文章粗略计算过，至少10个数量级以上；

我们生存的物理世界，是为人准备的，或者说，是人为了适应自己而改造的，而如果我们真的造出另一种“人”了，那么就会应该有完全不同的形态的：如同汽车干掉马车，电力干掉人力，互联网干掉传统通信。不抬杠，“干掉”从来不是指百分百消灭；

再具体一点，我们日常生活里存在的大量物品，都会讲，符合人体工学原理，它们存在的价值，它们的形态，是“为人所用”，但不代表，我们人有如此灵巧的手，未来的物理AI就需要“灵巧手”，这些也许都是过渡形态；

于是，这指向了最后一个问题，关于复杂度和进步速度的问题，如果复杂度过高，进步速度不够，过渡形态就会持续更长时间，也许最终就变成了“存在即合理”；

我越来越倾向于：复杂度比我们预期的显著高，而且很可能随着我们解决越来越多的问题，待解决的难题也会更多，这符合过去几百年现代科技进步的基本事实；

那么，如果过渡形态是长期合理的，我会有一些“不严谨”的推论：

我们离适合多场景的“人形机器人”依然很远很远，现实的选择就是特定场景的“机器”；

作为国人，大概已经很清楚，高度发达的国内制造业已经将“纯制造成本”（去掉材料，能源等）压缩到非常极限的位置了，这里面其实留给“机器人”的空间很小了，这个结论也是最早讨论“具身智能”时最大的质疑点；

想象空间很多都在生活场景，但是，生活场景的复杂度极高，而且需要应对非常多的corner case，其实，对“智能”的要求是很高的，即使是表象智能，我们依然缺少至少十个数量级以上的数据，有些数据可以通过所谓模拟，生成数据去解决，但绝大多数不能，因为如果可以的话，我们大概已经达到智能驾驶的L5了；

生活场景里的“机器人”与智能驾驶的车有两个最显著的区别：驾驶本质上还是一个相对封闭的场景，目标函数是确定的，遇到的每一个问题都有“最优解”，这条道路在数理逻辑上是不存在明显的障碍的；从更早时间开始卖出去的每一辆车是有成本承担者的，消费者本来就需要车，承担了所有成本，还能通过自己日常的驾驶为车厂提供足够多的数据，这个飞轮早就转起来了，现在是加速突破的时刻，生活场景里的“机器人”呢？

过渡形态是什么？我有一些想法，但是不敢在公开场合里过度讨论，也许只能点到为止：在同样技术可靠度的标准下，我们是给各种门植入非常便宜的自动控制模块更容易，成本更低，还是教会“机器人”处理各种“门把手”更容易，成本更低？

我特别喜欢去年下半年开始一直回荡在自己大脑里的一句话：这个世界，终究是物理的。我也特别喜欢自己二十年前翻开《经济学原理》教科书时的第一感觉：这不就是“普通物理”吗？

当然，也许加上后半句会更完整一点：不具备“预测性”的那种。

但也恰恰是这种“后验性”，可能反而对人类社会有更多的价值，因为这个世界，毕竟是“人”的，我们逃不脱那只“隐形的手”。