Google

Google


终于来到了这个时刻:写文章不用再一边写一边分心思考展现形式的问题,随着一系列工具从Gemini-2.5驱动升级为Gemini-3驱动,随着Nano Banana Pro基本完美的解决了文字渲染问题和图片元素的真实性问题。

过去十年,用了一堆各种超级文本编辑器,笔记工具,从最早的Notion,到过去五年的Obisidian,也试图写了一堆编辑器,就在自己认为几乎接近完成的时候,最终还是回到了Google Docs。其实,可以是任何文本编辑器的,哪怕vi都没问题,回到Google Docs的原因很简单,如果未来的数字世界就是模型驱动的,那么人可以自己记录的其实不多:文字,语音,照片,视频。

重要的也不再是如何记录,而是如何保存。所以,只是因为随时与Google Drive同步,偶尔还可以用一下Gemini生成和优化,没有任何多余的步骤。

文本编辑器还需要设定Google Drive的同步,还要保证所有的pc,手机都有同样的客户端体验。一切就该从简,而不是从繁。

语音应该是比文字效率更高的工具,手机备忘录的输入效率绝对比文字高,但文本编辑器是一个很好的“工作时记忆”,你随时随地可以看前面的文字,停下来思考,修改重组文字,或者继续下去。语音带有太强的时序属性,即使可以边说边翻译,但是一旦要重组和修改,其效率就大幅下降,甚至不如文本。但语音是一个很好的提示器,至少我的很多灵感来自于户外,来自于不面对电脑屏幕的时候,无论是在公交、地铁上,还是在拿着相机“看”世界时,或者是锻炼时,或者,也有对着窗外发呆时……

文字是典型的系统2,慢思考过程,语音是典型的attention,是关键词,我不知道算系统1还是系统2,可能都有吧。

以上一堆开场白,写的毫无心理压力,模型的不断进步,边界的不断拓宽,让我越来越相信两件事情:1. 符号不一定代表智能,但符合却是智能最重要的载体;2. 如今的AI正在向着前所未有的“执行器”的方向大踏步迈进,我还不确定这是不是会导向大家期待的智能或者AGI,但这无比坚实的一步,就是会产生远大于以往任何一次工业革命更大更深远的影响。

至少,人在这时候应该认真考虑的问题,并非会不会被AI取代,而是,我们如何与这个新物种有效分工。所以,既然此时此刻我可以毫无顾忌的只写文字,那么在可预见的没有什么打扰的接下来三四个小时里,我就只以文字把过去的实践、体会和思考记录下来,系统不系统无所谓,我的“助手”会帮我梳理,排版好不好看也无所谓,它也会帮我搞定,它还可以出简洁明晰的图文。

那么,从哪里开始呢?

从“留白”开始。过去三年里,AI不断提升与拓展着我的效率和边界,这已经成为一个显而易见的现实,但同时它也在提升着所有认真用户的效率与边界,从竞争角度说,技术进步就是公平的。所以它对我的价值从来不在于我产出什么,因为没有任何一项产出是有必要的。我的工作只是帮助这个世界更快的消耗能源,更快的“熵增”。

但是如果我不去进行这些无效的高效劳动的话,我可能就失去了大量进行思想实验的机会,我可能就失去了对“符号主义”的一次次实践认知,我可能就不会有机会可以越来越明确的感觉到思考与执行的分界线。

所以,留白,于我而言,是空出大量的时间在“无所事事”上,空出大量时间在推进AI执行的边界,而非代替AI执行上;留白,于我而言,就是多用眼去看,多用脑去天马行空:看到的一定是散乱的,天马行空的也一定是稀疏分布的。

如今的AI,对我们最大的价值,其实是,可以用一种我们不用太关心的数学模型和技术手段,给这些离散与稀疏加上坐标,既方便模型处理,更方便人去看。这大概就是所谓embedding的真实作用,中文翻译成嵌入,但其实应该是锚定,是定坐标。模型的预训练就是给越来越多的信息赋予越来越精确的坐标,所以,所有信息被锚定后,我们看到的就是一个非常高维的稀疏空间,处处是留白。

这就大概是符号主义的基本信仰,如果我们可以将足够多的信息赋予足够精确的坐标,它就应该是智能本身。这本该就可以了,但是被锚定好后的AI是自由的,它的所有留白都是无障碍无阻力的,所以它会“胡言乱语”,它会无所顾忌,让人害怕。

于是,我们出现了后训练,一种被人为矫正的规训:有些话不符合人类语法,要改,有些话价值不正确,不能说……

我们人就是见不得留白,见不得毫无遮挡毫不掩饰,一定要竖起高墙,甚至要造桥开路,要用所谓的“思维链”去让AI变得“智能”。

挺荒谬,但我们都挺喜欢的,因为,包括我在内,就希望AI是合格的高效“牛马”,就希望它是个很好的执行者。于是,我们拿出了期盼已久的词,Agent,其实英文本身意义挺准确的,代理或者执行,不过我们博大精深的中文一定要更高大上:智能加上一个物理概念,“智能体”。

我们其实一点都不希望“智能体”拥有“智能”,这不就是一个所有人包括我都乐在其中的讽刺吗?

讽刺的只是命名而已,其实一点都不重要。至少在这样的“规训下”,它又能回到正常的轨道上来了,模型进步的证明变得越来越可理解:不断刷新benchmark,不断以更低的成本工作更长的时间,完成更多的任务。

所以一个话题出来了:AI会取代人吗?

单纯问这个问题,答案肯定是,会。尽管人的温度是重要的,但是大家对于AI客服、AI主播的接受度似乎比我们预想的更高。企业尤其是科技企业,至少大量的初级技术岗位和中层管理岗位正在消失,失业问题似乎正被越来越多的讨论到。当然,也有很多反方观点:历次工业革命虽然消灭了很多岗位,但同时也创造了很多岗位。

正反观点,我都同意。但在我看来,问题只是在于时间。蒸汽机驱动的织布机对纺织工人的取代持续了几十年,但它同时创造了大量操作机器的岗位;电力和内燃机带来的影响时间也持续了很久,同时确实也创造了更多的就业场景;互联网革命带来的工作替代持续时间缩短到了十年的尺度,虽然它至少创造了电商、快递物流、网约车司机、直播等新兴就业岗位,但是以互联网发展带动的全球化分工,对传统制造业确实也造成了不小的冲击;

而我们正在经历的第四次工业革命,正在以半年为单位快速进化着,传统客服,初级程序员,初级设计师的大批替代已经是正在发生的事情,这些岗位的从业人员很多都依靠至少三四年以上的专业教育和培训来适应曾经的工作岗位,要让他们成批量的花费少于半年的时间去发现并适应新的岗位,并不容易,甚至是小概率的成功事件。

在一个关于时间的游戏里,许多人可能并不具备快速转换的能力。

当我参加一些行业交流会议时,听到几乎所有人都在讨论自己的成果或者产品可以替代多少人力时,我的心情其实高兴不起来:我知道这件事情几乎必然发生,但又却很可悲。

我不想在这个问题上纠缠太久了,终究,尽力经营好自己头上的一片天,对很多人来说,已经是竭尽全力了。我相信,人类一定有解决方案,我相信,几千年的历史已经证明了人可以适应各种变化。

可是,我们这一代人(七零八零)是幸运的,又是不幸的。

我们的幸运在于,当你认认真真按照“标准”成长:反复做标准化的作业,提高标准化考试的成绩,不管有没有上到大学,或者不管是不是好大学,按照一些标准化的模式去工作,去重复,只要运气不太差,结果大体还算过得去,尽管方差其实很大。

我们的不幸却在于,正是因为循规蹈矩的标准,成为如今AI的最佳参考样本。我们努力的过往,成为一个又一个具体的里程碑,当几十年的竭尽全力,都变成或长或短的01代码时,我们都成了长长的等待宣判的队伍里的一员。

没什么好贩卖焦虑的,没什么好忽悠“再不学AI就完了”的,更没什么好批判教育制度的。是过去几十年的好时代让我们产生了一种没来由的线性外推的自信罢了。是那些被人为设计出来的升学阶梯,职业规划在开始“反噬”而已。

是我们放弃了有趣的灵魂,批判性的思维,是我们在不断追求”大数定律”而已。

然而,那个号称培养“自由而无用的灵魂”的高等学府已经变了。

一直认为神经网络训练是一个很有意思的事情,无论优化器是什么,梯度下降都被广泛使用。回到人类社会,梯度下降其实就是沿着阻力最小的路径,但每一个阻力最小路径的累积,可能离最优路径是南辕北辙的。但是没关系啊,梯度下降至少有最强的确定性啊,最大的确定性就是社会分工后彼此最容易获得信任的方式啊。

于是,人与模型在这点上相互闭环了,AI就是最适合内卷,不是吗?

这个问题,似乎只能点到为止了。

这又是一个AI离“人类智能”越来越远的例证,只不过,这个“人类智能”要打上引号,可能就是我们以为的“智能”,那个本身就在远离我们的东西。

又回到了一个我本来以为已经有答案的问题,教育,或者说,很现实的,孩子应该学什么,选什么专业,我一直很坚定的应该是数学和计算机。然而,不知道从什么时候开始,我已经不那么坚定了,尽管我认为这依然是面向未来时代最重要的基础能力,但是我们讨论“选什么专业”,似乎是考虑的很现实的问题,就业。

AI正在一个行业一个行业的入侵人类工作,无论我们对于这件事情遣词造句多好听。

很不幸,我没有在上面所说的一个三四个小时的连续无打扰时间片里完成我本来想完成的内容,或许,我本来就没想好我要完成什么。

相反,在距离这个时间片后三天的时间里,我又完成了很多其他的“工作”。

我的节奏已经越来越变成,要么一鼓作气地完成,要么意兴阑珊地烂尾。

在三天以后的此时此刻,再去看上面的文字时,我没有了当时那种情绪,也就失去了在短时间里延续思绪的可能性。

我似乎想讲教育,我似乎曾经觉得自己有答案。

但可能我并没有。

或许,只是因为我找不到能够说服自己的“完美答案”。

一如,每个人都希望一支完美镜头:焦点清晰无比,焦外奶油般化开,风格柔美如画,锐利无比的同时又拥有完美自然的过渡,该数毛的地方必须分毫毕现,该写意的地方必须毫不生硬,一句话,每一个像素都必须主客观都完美。

对,上面的镜头是不存在的。

但是,AI生图一定可以在不远的将来做到。

我想过很多种这篇文章希望收尾的地方,就是没有任何一种设想甚至跟现在的状态有一丝一毫的接近,因为,这就是一张图。

我挺喜欢这张的,任何一个以前,我都会想着怎么可以拍到自己觉得更好一点的状态。如今,不完美,挺好的,我们所有的结果都将毫无意义,但我们可能会记住每一个按下快门的时刻。

← Back to Blog