Sep 3, 2025

ChatGPT“助手”功能发布后：OpenAI与Agent之间差一个硬件

OpenAI 推送了 ChatGPT 助手功能，命名为“Tasks”。

简单而言，就是可以给模型安排一个“定时计划任务”，模型到点就执行，并返回结果。例如，一个事件提醒，或者，一个每日新闻总结？

如上，就是一个搜索最新新闻，并返回结果的示例，为了可以立刻测试结果，我将任务执行时间设定在了测试时间的下一分钟。

一分钟后，果然就返回给了最新的新闻结果。

这大概是目前最有效的方式了。当然，理论上可以做得更复杂一点，例如连接到个人的 OneDrive 或者 Google Drive，根据最新的文档进行一些数据计算，然后返回结果。

当然，产生了这个想法后，我进行了一次小尝试，因为 ChatGPT 已经跟 OneDrive 进行了连接，所以，我给了这个任务：每天往 OneDrive 里写一首随机生成的诗。

遗憾的是，虽然 GPT 按时启动了任务，但是却无法完成写文件的操作。道理很简单：拿不到写权限。

当然，从执行程序本身看，没有任何问题。

那么，针对 GPT 前段时间加入的 APP 工具功能呢？

连接上了 iTerm2，愿望是希望能够打开终端，运行一下 “ls”。结果，收到了每半小时一次的“提醒”。

再次试了连接 Cursor，还是一个又一个的提醒。

对，它不拥有程序以外的能力，只能是一次又一次的提醒。

OpenAI 当然可以继续“星辰大海”，做更复杂的模型，也可以像如今一样，不断加入各种功能，让 ChatGPT 逐渐成长为一个超级 APP。

可是，AI 时代不需要超级 APP，跳不出 APP 本身权限之外的 APP，也就是一个生成式的辅助工具而已。一个只能给指导意见，不能直接干活的 Agent，称不上真正的 Agent。

也许，OpenAI 跟 Agent 的距离，就是这么一个硬件。

真正由 GPT 驱动的，而并非只是挂一个 ChatGPT 的图标的 API 调用。

语音对话功能，ChatGPT 已经有 Advanced Voice Model 了。

视频聊天功能，现在的 ChatGPT APP 也能一边开着摄像头一边问答了。

思考模型？o1 的表现很好了。

教育？有摄像头就可以交互了，也可以帮着提示作业。外加主打一个“陪伴”。

也许，OpenAI 的志向是真正的具备通用智能的人形机器人吧。

可是，看着 OpenAI 一次一次的往应用里塞功能，却每一个都受限于 APP 的形态，明明很想要，却还要装出很清高的样子，居然有点为它小小的难过了。