对于关心我结论的人,TL;DR如下:
随着模型能力的不断增强,模型可以完成的日常任务越来越多,相应的,新想法也会以更快的速度冒出来,倚重某项模型能力的应用(比如coding,比如搜索)可能逐渐会被模型能力和模型应用覆盖,但那些组合多个模型多项工具的想法,是模型应用无法触达的,甚至也是模型公司本身无法触达的。
应用也越来越像AI数据中心,不仅仅需要加速卡(对应模型),还需要连接(模型与模型,工具与模型,工具与工具),需要存储(数据,知识库),需要自动化workflow,更需要scale up。
以下是内容:
Gemini最近对Gemini应用中的Canvas进行了功能增强。
卖家秀很好,但是对于我这样每天都会使用的人而言,这属于常规操作。
我更关心跟AI Studio中的Build的比较,于是,考虑把Build里生成的一套报告可视化工具放到canvas中看可以做到什么程度。
然而,一个多页的要求只能完成到下面的样子:

而我的要求差不多是:截图基于Gemini另一套工具Stitch的设计。

当然,有一点Build做不到的:Canvas可以直接调用Gemini的TTS模型生成语音。

这个TTS_MODEL默认是gemini-2.5-flash-tts,而在Build中暂时还无法调用gemini系列的tts模型。

当然,Canvas定位于只是单个HTML的生成,所以做到这样也属正常。
随着Canvas的这次更新(我其实没感受到太大的区别),我们大概可以看到模型公司与应用公司逐渐清晰的界线:
随着模型能力的不断增强,模型可以完成的日常任务越来越多,相应的,新想法也会以更快的速度冒出来,倚重某项模型能力的应用(比如coding,比如搜索)可能逐渐会被模型能力和模型应用覆盖,但那些组合多个模型多项工具的想法,是模型应用无法触达的,甚至也是模型公司本身无法触达的。
应用也越来越像AI数据中心,不仅仅需要加速卡(对应模型),还需要连接(模型与模型,工具与模型,工具与工具),需要存储(数据,知识库),需要自动化workflow,更需要scale up。
我开发应用工具的一个重要战场还是在AI Studio的Build中,如上所述,Canvas应该不会对其带来任何取代,规模和能力不同。但是,Build的承载力也是有限的,在其中试验成功的原型工具,虽然已经可以为日常生产所用,但还是要面对如何Scale的问题。
如上Canvas类似的工具,在Scale前,我对Build中的版本进行固化,并分享出来。
这个工具叫做“Report Visualizer & Narrator”,报告可视化及语音解说工具。AI Studio的分享链接如下,有AI Studio账户的用户都有“Viewer”权限。

我生成这个工具的初衷是为了对每日自动化日报进行可视化和语音播报,最后自动生成视频。但是这个三步走在Build中只能完成一步半:可视化,生成口播稿,也可以语音播报,但是只能用桌面系统自带的模型,效果“喜人”。
这也是需要脱离Build工具进行Scale的最重要原因。
一个基本的使用流程是:
输入报告文字;

选择样式和模型,我配置了不同风格的样式。


检查生成结果;

生成口播稿,并且可以播报,虽然声音很机器;

我配置了不同的样式,当然因为主要是为了日报服务的,所以内容上会固化一点,不过影响不大。
比如,苹果liquid glass风格。

Nano Banana海报风格。

写在最后:AI对我带来最大的改变就是,我是一个脑子里会不断冒出“新想法”的人,它的速度远远快于我的能力和执行力。所以在六七年前,我对自己进行了一些强制,不许自己有“新想法”。如今,AI的能力和执行力都远强于我,我们开始匹配了。
甚至,我不再认为自己是一个“想法很多的人”,而是时常会觉得自己是一个“没什么想法的人”。