本意是在使用了Perplexity的Lab功能一段时间以后,写一篇关于这个类似于Manus的功能的评论,但是在梳理思路和准备素材时,突然想到了更多的话题,所以这篇文章会分成两部分,一部分是功能评价,一部分是关于AI应用的启发。
进入第一部分:Perplexity的Labs功能。
这当然不是一个刚刚发布的功能,至少我被推送到这个功能是在5月份,所以,这是一篇相对迟到的评论。
页面很简单,就只是在传统的“Search”,“Deep Research”旁边多了个“Labs”。如果说这个功能的定位,那就是跟年初“出圈”的Manus几乎一致。
当然,从功能发布到现在,还是可以很清晰的感知到这项功能在不断的迭代进化,变得更强大。这是我最喜欢Perplexity的地方,每隔几天就会觉得“又进步了”。
该功能跟“Deep Research”本质的不同:Deep Research纯粹是一个勤奋的信息检索和汇总bot(有些解决方案里把它作为Agent,但有些解决方案里是相对独立的模型,所以可能叫bot更合适吧),产出结果更多是素材。但是“Labs”的目标就是直指最终结果,一篇报告(word,markdown,网页,pdf,等等)或者一个ppt,或者其他,这是标准的多agent组合,而且更倾向于将搜索与代码生成结合,更多的代码来实现最终的呈现结果。
一个例子:关于苹果供应链迁移的问题。
最终结果就是一个典型的图文并茂的分析报告:既有搜索到的图片,也有使用代码生成的图表。

而且是底稿完整的,不仅有来源链接,更是在“Assets”下把所有代码和生成的图表都完整的给出了。

都是Python代码,适合与传统的报告形式兼容,毕竟传统报告形式里都是图片。
任务执行的过程也很清楚:

结果可以导出到下述形式:

在这里,我给出Page的分享链接:
苹果供应链迁移
https://www.perplexity.ai/page/ping-guo-gong-si-quan-qiu-gong-C2coWm5EQjWpUAeZdJBtcA
但是,当分享到Page时,代码执行结果和那些图片就看不到了,Perplexity还需要更多的内部功能整合吧。
抛开内容中的“事实描述和数字准确性”(细节是需要一项项核查的,当然Perplexity在这一块的过往记录并不太好),“Labs”功能的完成度和最终交付品,是非常好的(相比刚发布时,内容又丰富了不少),仅就结果而言,我主观可以给70-75分,考虑到是在几分钟内生成的,可以给到85-,A。
当然,公平起见,必须也看一下目前的Manus的能力,所以同样的任务我在开始写这篇文章时,交给了Manus完成。到现在,20分钟过去了,Manus还在努力工作中,期间,需要我手动辅助访问Reuters(当然不成功)。

当然,它现在还在工作,写完文字部分后,再补充图片等信息。

有种看小说故事的即视感。
毫无疑问,现在的Perplexity的Labs是秒杀Manus的:专业的事情,是无法投机取巧的,“Computer Use”和“Browser Use”可以很酷炫,但是点错“技能树”,而且是“拿来主义”的技能,结果确实不太妙。当然,我相信这个团队还可以做出更好的产品,只不过这恐怕是后话了。
Manus结果的最终版是一篇五页的PDF报告。图表使用了文生图功能,更像是GPT-4o的产出。其实以前老老实实生成python代码不是更好吗?

当然,它也值得再给予一次机会的,毕竟有一个创建网页的按钮。

然后,我还是错了,算了,不提它也罢。
当然,以上可能只是一个Manus不擅长的例子,不代表其他场景不好。
回到Perplexity Labs。
评分已经说过了,个人觉得还是挺高的。
其实,Perplexity自从推出后就一直在做内容,无论是Discover,Page,Finance,Travel,Academic,还是现在的Labs,最初喜欢这个产品是简单的出于“分流搜索偏好”(用Perplexity搜八卦,日常,可以有效的确保Google搜索给我推送信息的聚焦),然后是因为不断在持续改进。
如今,它又给了我新的启发,重新去考虑关于AI应用的问题。简化期间,我不从这个起点开始,而是自己重新梳理的逻辑链条出发:
- 场景:今年以来,我在案头的时间越来越长,原因很简单,Deep Research的出现和AI代码能力的大幅进化(Claude-3.5为分界线);
- 推理需求:推理需求的大幅提升和市场上普遍评论的Anthropic依靠Claude模型实现收入快速增长,也大概是以Claude-3.5为分界线;
- 屏幕时间:“更多时间坐在显示器面前,而不是拿着手机”,可能不是我这样的个案,而是具备一定的普遍性;
- 社交需求之信息获取:社交需求明显下降了,这个问题在三十年前家用电脑开始普及时开始被广泛讨论。我想,在当前的时间,基于“获取信息”和“任务实现”目的的社交需求确实出现了大幅压缩的情况,实质还是AI搜索和AI Coding能力的大幅提升;
- 数据:我简单看了下库里的数据,目前全球一年的PC(包含笔记本电脑)销量在2.5亿出头,手机销量超过12亿。虽然因为AI等原因,PC销量从负增速回正,但是依然可以得出基本的结论,相比手机,PC的场景确实小很多。如果考虑屏幕占用时间的话,可能会小更多;
- 多出来的手机屏幕时间做什么?是不是“无脑刷视频”的负罪感没那么大了?但是我们会更希望看到“真人”,对吧?
- 基础模型以外的AI应用的机会并不大:实践一直在强化自己长期持有的一个观点,AI应用层的机会自然非常大,但是独立应用的机会越来越小。原因很简单:1)按上面的数据,用户量是不如以前的;2)因为场景更多在“案头”,所以其实用户有更多时间去调配“个性化”的过程和结果,所以即使像今天介绍的Perplexity Labs功能表现不错,也很难带来显著的付费提升;3)AI模型本就在应用层的,我们也看到ChatGPT、Gemini、Claude正在越来越成为完整的应用(整合工具、搜索、Agent),虽然速度可能会比Perplexity等第三方应用慢,但是核心在“模型能力”;
- 基于AI的生产场景和基于手机APP的移动互联网场景也许仍将并行一段不短的时间,这大概是模型特性和人的生理心理限制共同决定的,其实,这样挺好的。
于我而言,我高频使用的场景、模型和应用越来越聚焦,如果这多少有点代表性的话,或许也意味着,留给模型外三方应用的机会窗口越来越小了。