很长一段时间,我一直持有一个观点:只要有一个IDE,或者CLI类命令行应用,就可以完成所有人与AI的协同工作:AI生产力的实质是代码。
我也一直认为,从逻辑上,这没什么问题。
直到,同样一个任务,我在Google的Antigravity里解决的并不太好,而在Claude(Claude是模型,但是比公司Anthropic有名的多,就这样吧)的Cowork里实现的跟我预想更接近,让我意识到一些不一样的问题。
这不是两个模型能力的差距(Gemini-3与Claude-4.6),会有一些方向性的区别,这个后面可以专门简单总结一下;
而是,我的任务是一个批处理的分析任务,执行数量需要做搜索和筛选工作,Antigravity执行了66个批次,Cowork是38个,但是Antigravity搜集完所有的数据后,居然写了个python程序去分析,而Cowork直接交给Claude-4.6 Opus模型处理;
所以,结果,自然是,Cowork更符合我的要求。
是的,问题就在这里,Antigravity被预设为一个Coding的IDE,用代码解决问题的权重显然更高,Cowork就是利用好模型辅助工作任务,虽然写代码实现是一项非常基础和常见的设定,但显然在Cowork的预设里,“用模型解决问题”是更优先的选项。
因为Claude-4.6 Opus实在太贵了,我不愿意重复“解锁五小时,干活十分钟”的漫长等待,优化了一些提示词后,也很快在Antigravity中完成了任务。
但是,这个过程却给了我一些不同的启发:也许,根据不同的场景,确实需要不同的IDE,或者至少是不同的APP形态的。我以前的想法有点过于理想化了。
或许,Anthropic的开发者也可能经历了类似的过程,然后快速推动了Cowork的发布,至于效果,看那些“软件股”的投资者如何胆战心惊就可见一斑了。
自从模型赶上来之后,Anthropic一直在自己的道路上快人一步的提出新的设想,新的小产品或者小更新,虽然每一个看起来都很“轻”,技术含量也没那么高,但是带来的标准的改变确实是惊人的。
- 第一个推出Artifacts,使得模型成为很好的前端快速demo和可视化工具;
- 第一个提出MCP,尽管依然是API的进化,但确实快速推动了一系列三方工具与模型的对接;
- 第一个提出Skills,既是对MCP的巨大补充,更在规范化Agent最终产出上迈出了重要的一步(当然,我要自夸一下,去年我做的OpenResearch其实跟Skills的设想和要解决的痛点几乎是一模一样的);
- 第一个推出了Cowork;
其实,在历时两年不到的这些进化历程中,模型能力虽然有进步,但更多的显性化结果来自于“思考模型”和Agent层面的优化整合,同时,代码本身相对于“世界知识”而言,是个比较小的集合。
Anthropic真正的核心竞争力是那种在一个方向上集中精力,快速迭代的状态。你能在使用他们模型和产品的过程中随时感受到与开发者的一种“精神共鸣”:你们面对同样的问题,原来可以这样解决,原来还是解决不了,原来这里藏着个体现“审美价值观”的小彩蛋,哈哈。
这种内核,OpenAI有过,在GPT-4o及以前,甚至在ChatGPT发布前可以感受到更多,如今,似乎已经难觅踪迹,只在最新的产品Prism上找到一点点残留,但是基于Latex的优化,受众不少,需求太窄了。
这种内核,Google也一直保持着,只是,或许总是摆脱不了“大企业病”的问题,它的外显总是不稳定:相比于Gemini-2及2.5发布后下饺子般的labs应用更新和ai-studio产品更新,Gemini-3之后除了nano banana pro条线上的,新应用的发布似乎沉寂了很多。也许,想要的面太广了,算力需求匹配不上,也许,是其他不为我们所知的原因。
从“基因”而言,我依然跟Gemini更为匹配:显然它拥有多得多的“世界知识”,它更全面多能,它的多模态能力更强,它的生态更丰富……
但是,过去几年里我最大的收获也在于逐渐意识到,在更重要的超过90%的“落地”场景,需要专注,需要“打穿”,需要更标准化,这些方面,Anthropic(Claude)确实越做越好。
我只有一个“不满”:太贵了。