又一篇token经济账,继续安利“质量不高”的notebooklm

又一篇token经济账,继续安利“质量不高”的notebooklm


看到一篇前段时间 singal65 上的关于不同架构推理成本计算的文章:https://signal65.com/research/ai/from-dense-to-mixture-of-experts-the-new-economics-of-ai-inference/,素材其实主要来自于 SemiAnalysis,不过整理的也还不错。

我在去年十月份写过一篇相关的文章,结论基本是差不多的,不过当时数据更多来自于 MLPerf,涉及到的硬件和模型类别也会更多一点。

从基本结论而言,其实跟三个月前没有什么变化,不过经过这段时间,可能可以 highlight 的更清晰一点:

  • 模型架构和硬件架构其实是高度绑定的,MoE 最吃互联,无论是节点内还是节点外,这是 NVL72 发挥最大效能的场景;
  • Dense Model 和 Diffusion(文生图)更考验单芯片的能力,特别是内存容量和带宽,所以我们看到无论是 GPU 还是 ASIC,内存越做越大,带宽越做越大,因为这适合几乎所有模型;
  • 所以,制程和 HBM,对吗?对了,看起来单芯片能力上(NV 官方数据),Rubin 相对于 Blackwell 的提升确实比 Blackwell 相对于 Hopper 的提升更大;

有一点特别的更新,是这段时间逐渐加强的观点:

LLM 本身基本走到尽头了,尽管更大规模和更多数据可以带来“感观”上更大的提升,但这越来越像每年 PC 和手机芯片的提升,直接比较参数看起来很直观,好像速度也确实变快了,但是能实现的任务和功能还是那么多。

目前大家普遍在期待基于 GB200 或者 300 的集群训练出来的第一个模型的表现,实话说,我的预期没有那么高:“表象智能”看的就是数据和数据压缩能力(模型架构)。Gemini-3 呈现出来的强大的多模态能力(也是数据)掩盖了在纯文本模态部分其实提升很有限的“残酷现实”。

如果确实如上所述的话,找到全新的模型架构自然是最重要的,但是同样需要找到 scaling law 的背景下,硬件架构将更为重要。Google 的隐藏优势其实就是在这里:虽然芯片甚至集群能力相比 NV 确实差至少超过一代,但是如何组网,如何在框架层优化,配合自身的模型架构,它又领先 NV 一个身位。

现在基本达成共识的是,“多模态”,不是多模态的输入,而是多模态的输出;“Agentic”,不是在模型之上套 Agent,而是与“多模态”整合在一起;

综上,对模型架构及硬件架构的挑战会越来越大:Google 当然依旧具备最大的优势;NV 的硬件足够多,用户足够强,可以针对最新发现的问题及时设计更新产品架构,事实上,他们也是在这么干的;而其它,无论是 GPU 的“备胎”还是自研 ASIC,其实,大量缺的是非常理解算法和硬件的“工程师”。

这样的人有吗?当然,Jeff Dean 就是,但目前世界上真的只有一个 Jeff Dean。

在超大数据中心里,每一天都会遇到千奇百怪的“新问题”,当电源稳定性、硬件瓶颈和软件栈的 bug 与温度交织在一起时,找到问题总是需要足够的经验,一些创造力,还有,运气。

好了,有点跑偏了。一句话总结:当 Token 生成成本成为最重要的经济指标时,背后是极高极高的壁垒,看得见的和看不见的,所以,我会不断 DS 英伟达的“过度宣传”,因为这些壁垒的实质是,人,极少数的看不见的人,远远不是“买来即用”的状态。

到第二个部分内容:继续安利 NotebookLM,其实是继续安利 Google 构建起来的 Gemini 生态。

客观而言,NotebookLM 输出质量不算高,最多也就发挥了 Gemini 模型能力的五六成左右,但我安利的理由也很直接:

它更符合人的工作流程,同时又是 Gemini 生态中一个重要的输出节点:我可以把自己的文章(在 Google Docs 里写)、互联网内容(文本,视频,等)、简单手写的 outline 整合归档在一起,这就是 AI 时代一个巨大的改变;

可以针对一篇或者多篇内容进行各种类型的输出:mindmap,infographic,slide,overview,等等,比如基于本文开头说的 singal65 的文章;

image

输出的第一目的其实不是为了直接拿来发,而是方便自己快速整理、比较:有些点模型提到了,但是自己忽略了;有些点自己觉得更重要,但是模型忽略了;有些点,可能是自己错了,也可能是模型错了,背后的原因更有价值,如下图,最右边的部分显然有错误,错误发生在哪一部分其实更重要;

image

我当然有信心用自己的工具和流程可以在生成质量上超过 NotebookLM,但是成本和效率,又显然是 NotebookLM 远胜,足够高效和成本可控的工具更容易让人产生黏性,更容易改变人的习惯,后者或许是这个时代更重要的。

当然,我们可以找到一堆“平替”,包括我自己也做了些工具,但 NotebookLM 并不只是一个工具,它是 Google 的 WorkSpace,是 Google Drive,是 Google 的 Youtube,是 Google 的搜索,是所有这些生态内产品在 Gemini 多模态能力加持下的交汇。

所以,它真的是一个好工具,帮助我们,提高效率; 所以,它真的是一个好工具,帮助我们,找到需求; 所以,它真的是一个好工具,帮助我们,优化流程; 所以,它真的是一个好工具,帮助我们,理解 AI;

历史上,我们的线性外推经常是错的,关于 2026,可能真的不是 AI 取代工作岗位,或者是,人类的反击?

尽管也大概率是错的,但这样的推测更符合我这段时间的感受,更符合内心的“不安全感”。

← Back to Blog