OpenAI 推送了 ChatGPT 助手功能,命名为“Tasks”。
简单而言,就是可以给模型安排一个“定时计划任务”,模型到点就执行,并返回结果。例如,一个事件提醒,或者,一个每日新闻总结?
如上,就是一个搜索最新新闻,并返回结果的示例,为了可以立刻测试结果,我将任务执行时间设定在了测试时间的下一分钟。
一分钟后,果然就返回给了最新的新闻结果。
这大概是目前最有效的方式了。当然,理论上可以做得更复杂一点,例如连接到个人的 OneDrive 或者 Google Drive,根据最新的文档进行一些数据计算,然后返回结果。
当然,产生了这个想法后,我进行了一次小尝试,因为 ChatGPT 已经跟 OneDrive 进行了连接,所以,我给了这个任务:每天往 OneDrive 里写一首随机生成的诗。

遗憾的是,虽然 GPT 按时启动了任务,但是却无法完成写文件的操作。道理很简单:拿不到写权限。
当然,从执行程序本身看,没有任何问题。

那么,针对 GPT 前段时间加入的 APP 工具功能呢?

连接上了 iTerm2,愿望是希望能够打开终端,运行一下 “ls”。结果,收到了每半小时一次的“提醒”。

再次试了连接 Cursor,还是一个又一个的提醒。
对,它不拥有程序以外的能力,只能是一次又一次的提醒。
OpenAI 当然可以继续“星辰大海”,做更复杂的模型,也可以像如今一样,不断加入各种功能,让 ChatGPT 逐渐成长为一个超级 APP。
可是,AI 时代不需要超级 APP,跳不出 APP 本身权限之外的 APP,也就是一个生成式的辅助工具而已。一个只能给指导意见,不能直接干活的 Agent,称不上真正的 Agent。
也许,OpenAI 跟 Agent 的距离,就是这么一个硬件。

真正由 GPT 驱动的,而并非只是挂一个 ChatGPT 的图标的 API 调用。
语音对话功能,ChatGPT 已经有 Advanced Voice Model 了。
视频聊天功能,现在的 ChatGPT APP 也能一边开着摄像头一边问答了。
思考模型?o1 的表现很好了。
教育?有摄像头就可以交互了,也可以帮着提示作业。外加主打一个“陪伴”。
也许,OpenAI 的志向是真正的具备通用智能的人形机器人吧。
可是,看着 OpenAI 一次一次的往应用里塞功能,却每一个都受限于 APP 的形态,明明很想要,却还要装出很清高的样子,居然有点为它小小的难过了。