Jan 7, 2026

又一篇token经济账，继续安利“质量不高”的notebooklm

看到一篇前段时间 singal65 上的关于不同架构推理成本计算的文章：https://signal65.com/research/ai/from-dense-to-mixture-of-experts-the-new-economics-of-ai-inference/，素材其实主要来自于 SemiAnalysis，不过整理的也还不错。

我在去年十月份写过一篇相关的文章，结论基本是差不多的，不过当时数据更多来自于 MLPerf，涉及到的硬件和模型类别也会更多一点。

从基本结论而言，其实跟三个月前没有什么变化，不过经过这段时间，可能可以 highlight 的更清晰一点：

模型架构和硬件架构其实是高度绑定的，MoE 最吃互联，无论是节点内还是节点外，这是 NVL72 发挥最大效能的场景；
Dense Model 和 Diffusion（文生图）更考验单芯片的能力，特别是内存容量和带宽，所以我们看到无论是 GPU 还是 ASIC，内存越做越大，带宽越做越大，因为这适合几乎所有模型；
所以，制程和 HBM，对吗？对了，看起来单芯片能力上（NV 官方数据），Rubin 相对于 Blackwell 的提升确实比 Blackwell 相对于 Hopper 的提升更大；

有一点特别的更新，是这段时间逐渐加强的观点：

LLM 本身基本走到尽头了，尽管更大规模和更多数据可以带来“感观”上更大的提升，但这越来越像每年 PC 和手机芯片的提升，直接比较参数看起来很直观，好像速度也确实变快了，但是能实现的任务和功能还是那么多。

目前大家普遍在期待基于 GB200 或者 300 的集群训练出来的第一个模型的表现，实话说，我的预期没有那么高：“表象智能”看的就是数据和数据压缩能力（模型架构）。Gemini-3 呈现出来的强大的多模态能力（也是数据）掩盖了在纯文本模态部分其实提升很有限的“残酷现实”。

如果确实如上所述的话，找到全新的模型架构自然是最重要的，但是同样需要找到 scaling law 的背景下，硬件架构将更为重要。Google 的隐藏优势其实就是在这里：虽然芯片甚至集群能力相比 NV 确实差至少超过一代，但是如何组网，如何在框架层优化，配合自身的模型架构，它又领先 NV 一个身位。

现在基本达成共识的是，“多模态”，不是多模态的输入，而是多模态的输出；“Agentic”，不是在模型之上套 Agent，而是与“多模态”整合在一起；

综上，对模型架构及硬件架构的挑战会越来越大：Google 当然依旧具备最大的优势；NV 的硬件足够多，用户足够强，可以针对最新发现的问题及时设计更新产品架构，事实上，他们也是在这么干的；而其它，无论是 GPU 的“备胎”还是自研 ASIC，其实，大量缺的是非常理解算法和硬件的“工程师”。

这样的人有吗？当然，Jeff Dean 就是，但目前世界上真的只有一个 Jeff Dean。

在超大数据中心里，每一天都会遇到千奇百怪的“新问题”，当电源稳定性、硬件瓶颈和软件栈的 bug 与温度交织在一起时，找到问题总是需要足够的经验，一些创造力，还有，运气。

好了，有点跑偏了。一句话总结：当 Token 生成成本成为最重要的经济指标时，背后是极高极高的壁垒，看得见的和看不见的，所以，我会不断 DS 英伟达的“过度宣传”，因为这些壁垒的实质是，人，极少数的看不见的人，远远不是“买来即用”的状态。

到第二个部分内容：继续安利 NotebookLM，其实是继续安利 Google 构建起来的 Gemini 生态。

客观而言，NotebookLM 输出质量不算高，最多也就发挥了 Gemini 模型能力的五六成左右，但我安利的理由也很直接：

它更符合人的工作流程，同时又是 Gemini 生态中一个重要的输出节点：我可以把自己的文章（在 Google Docs 里写）、互联网内容（文本，视频，等）、简单手写的 outline 整合归档在一起，这就是 AI 时代一个巨大的改变；

可以针对一篇或者多篇内容进行各种类型的输出：mindmap，infographic，slide，overview，等等，比如基于本文开头说的 singal65 的文章；

输出的第一目的其实不是为了直接拿来发，而是方便自己快速整理、比较：有些点模型提到了，但是自己忽略了；有些点自己觉得更重要，但是模型忽略了；有些点，可能是自己错了，也可能是模型错了，背后的原因更有价值，如下图，最右边的部分显然有错误，错误发生在哪一部分其实更重要；

我当然有信心用自己的工具和流程可以在生成质量上超过 NotebookLM，但是成本和效率，又显然是 NotebookLM 远胜，足够高效和成本可控的工具更容易让人产生黏性，更容易改变人的习惯，后者或许是这个时代更重要的。

当然，我们可以找到一堆“平替”，包括我自己也做了些工具，但 NotebookLM 并不只是一个工具，它是 Google 的 WorkSpace，是 Google Drive，是 Google 的 Youtube，是 Google 的搜索，是所有这些生态内产品在 Gemini 多模态能力加持下的交汇。

所以，它真的是一个好工具，帮助我们，提高效率；所以，它真的是一个好工具，帮助我们，找到需求；所以，它真的是一个好工具，帮助我们，优化流程；所以，它真的是一个好工具，帮助我们，理解 AI；

历史上，我们的线性外推经常是错的，关于 2026，可能真的不是 AI 取代工作岗位，或者是，人类的反击？

尽管也大概率是错的，但这样的推测更符合我这段时间的感受，更符合内心的“不安全感”。