周末,会强制自己从原来的节奏里跳出来。想什么一直比做什么更重要,如今,更为突出。因为有了AI,做什么越来越不会是个问题。但是很多问题,不是扎在一条路里线性外推,就会有答案的。
昨天,更新了一下fabric项目,https://github.com/dmquant/fabric , 主要是对Cloudflare Worker的endpoints进行了一下拓展。有些Gemini Build里的项目需要持久化的存储,而且是跟session无关的,所以加入了app级别的post和get及对应的assets管理,同时,抽象化掉app自己的数据结构,反正无非就是markdown,json,html(js,ts,css),wav(mp3),jpeg(png),mp4,csv这类,worker负责存取,app负责解析,不需要大而全的软件系统,简单统一的后台即可。
为什么办公自动化搞了几十年,最终最方便的还是office,因为只要标准化输入输出,剩下的就该由人自己发挥主观能动性。
这也是我理解的AI-Natvie的第一个本质:让模型提供最大的灵活性,剩下的管好读写就可以了。
同时,我现在其实已经不太使用Claude Code也基本不使用Claude模型编码了,如果需要的话,会用Codex解决,但是我的产出更高了,大量的工作全部转移到了Gemini AI Studio的Build(Build这个名字很符合我的习惯,但是为了想读者交代清楚,前缀又太长了)里,尤其是当打通Cloudflare后台后,几乎无所不能。
Build对我最大的教育就是:不要想着大而全,all-in-one,每一个从实际场景里出发的需求都可以被简化成一个小工具,然后再找机会组合。
这成为我理解的AI-Native的第二个本质:为实际场景需求重新造轮子,简单的轮子,无论这个轮子被叫做APP,还是Agent。
是的,因为有了上面两条个人理解(不一定对且全面,但是“对和全面”留给知识付费赛道的老师们吧),我也走上了新的“歧途”:任何想法我都会落实到Build里。
AI Coding就是最大的生产力工具,它几乎彻底改变了我,也正在改变越来越多的人。
但是在进入我要举的一些新的例子之前,还是可以tldr一下:
AI Coding适合任何人,它是一门前所未有的“编程语言”;
但是不是所有模型都适合所有人,为什么Claude模型是大家认为最好的编程模型?因为它最“傻瓜化”,几乎不需要什么编程基础,就可以实现很符合自己需求的结果。这不是模型本身的功劳,是Agent配方贡献巨大;有些模型,比如国产的Kimi,Minimax,GLM,QWen,他们学会并发扬光大了Agent“任劳任怨”的优秀品质,能在实现框架上走得更远,更面面俱到,但在具体内容上,就多少有些“先天不足”了;有些模型,比如Gemini,GPT,则潜力巨大,给的要求越精准,得到的结果越“漂亮”,更像共同探索的伙伴;
因此,想快速得到结果,就选Claude,要琳琅满目,就上国产的Agent加持的模型,要在精细化的调教下得到相对稳定可靠的结果,就上GPT,Gemini,如果要规模化,使用Claude/GPT/Gemini定型后,用国产模型规模化落地,则是成本更优的方式。
好了,进入“人”的环节。
与软件系统开发没有任何变化的是,所有的需求都来自于实际的场景。变化的只是,当我们提的出需求时,最需要的应该不再是程序员,而是AI了。
这就是我一直认为自己很幸运的点:我是自己的需求方,我也是我自己的实现方。
但是,我依然要遵循一个基本的流程:1.想法的简单验证;2.设计;3.MVP实现;4.调整设计;5.反复修改;6.增加需求;7.规模化;
这个流程也跟软件工程的基本流程区别不大,当然,少了很多文档、确认、扯皮的环节。
所以,在这个过程里,也如软件工程一样,需要很多工具:有设计工具,画流程图工具,文档管理工具,测试工具,等等等等……
这些也是我写这篇文章的初衷:尽管上面提到的所有用户基数大的工具都在AI化,但当一个组织缩减到甚至只是一个人的时候,这些工具再怎么AI化,都满足不了需求了:那些为了管理而管理的功能太多,那些为了“好用”的功能和设计却越来越少。
所以,当我要画流程图时,我让Build做了下面的Canvas工具:徒手画一些示意图(被大部分遮住的那些),然后简单的写一些解释,让Nano Banana一次生成,还可以修改。
是的,这不是一次成型的,我在不断使用中发现的“反人性”的功能,都进行修改。
我是自己的用户,我是自己的开发者,我就可以让它越来越接近我理想化的工具,也在这个过程中不断优化着自己的流程和使用习惯。
然后,我导出,扔给Gemini-2.5-Deep-Thinking去设计,这个拿IMO金牌的模型是迄今为止唯一一个远超其他模型的模型:它很准确,它很克制,它不会过度思考,它给的方案都是可实现的,它可能真的有“智能”……
它,远远超过GPT-5-Pro。
是的,然后我要编辑,我要写一些文档,我需要AI编辑功能,我需要多模态的支持,我需要可以嵌入一些JS代码,于是,有了Editor。


还有一系列其他的工具,有跟研究相关的,有跟摄影相关的,有跟视频相关的。
任何想法,我都会先去尝试做一个工具出来,这是我理解的AI原生。
然后,我把工具往前推,看能走多远,看可以承载多少能力,然后,推着推着,它们又启发到我了新的部分,让我可以回头再去修改一些以前推不下去的工具,甚至把工具重新整合。
我喜欢这个时代,AI Coding的时代,跟APP,跟Agent,都无关,只跟人自己有关,只跟想法有关,只跟“取悦自己”有关。
这是,三十多年前开始学编程,三十年前看Bill Gates自传时种下的最简单的关于终生程序员的梦想,如今,其实每个人都可以。
这就是最好的时代。