出一个系列,是对过去几天AI领域事件的一些短评,频率初步定在两周三次,当然,有重大更新,必须第一时间。
1、央视推出首部AIGC动画片《千秋诗颂》。
我一直认为文生图,文生视频,都是用在B端的,当然如果把自媒体当作C端,说这是to C的,也行,都可以。所以,这意味着模型是要跟生产的内容深度绑定的,也就是说模型是内容生产里的一个工具与环节,而不是有了一个人人都可以用的上的模型,大家就都成了艺术家了,就去取代那些专业人士了。人人可得的内容,几乎意味着一文不值。
所以,央视的这部完整动画片,很确定的展示了这样的方向。从视频效果看,其实是略超我的预期的,技术永远是工具,技术越先进,对想象力和审美的要求就越高。
但是,一句话表达,AIGC本身不能成为“卖点”,通过AIGC实现过去的“不可能”,才有买单者。
2、英伟达推出RTX 500和1000 Ada显卡。
这两款显卡主要面对笔记本市场,主打“AI PC”功能。内存分别为4GB,6GB,INT8下算力分别为154,193TOPS。功耗分别为35-60W,35-140W。

虽然我认为AI PC不会那么快普及,但是来自芯片的残酷竞争已经开始。笔记本市场是芯片厂在AI PC领域竞争的第一个重要战场,核心问题是推理能力与功耗的平衡,在SoC逐渐成为Intel、AMD、高通给出的确定性解决方案的趋势下,英伟达的长期规划大概率是基于Jetson产品线推出独立的面向笔记本的SoC方案。但是在Windows for Arm尚待大幅升级以及微软与高通的独占协议尚未到期(坊间比较确定的说法是今年到期,但是没具体时间)的背景下,英伟达适时推出两款入门级的专业显卡,算是非常快的应对。特别是500的功耗只有35-60W,推理能力却大幅优于Intel和AMD的SoC,与CPU配合后,笔记本整体功耗预计在略超100W的水平,对很多用户的吸引力还是足够的。
3、Mistral AI正式发布新一代模型。
前两天,Mistral悄悄推出了叫做“next”的模型,我也试了一下,确实在数学与编程能力方面有很强的能力。
昨晚,公司正式在官网发布新一代模型,当然,目前还没有找到下载参数文件的链接,官网也宣布与微软Azure云合作,接入Azure云,所以后续是否开放参数文件下载,存在不确定性。

从Mistral官网发布的MMLU评分看,确实是目前仅次于GPT-4的模型。今年的模型之争其实主要也就在下面这些玩家里了,多模态当然是模型进化非常重要的方面,但仅就语言模型部分而言,一方面,都是在规划与搜索能力上下功夫(推理能力是表现),另一方面,长tokens(例如Gemini 1.5 Pro的一百万tokens,已经几乎确定的即将出现的一千万tokens)与RAGs的孰优孰劣,我基本上是站在长tokens这一头的,但是这也可能意味着,RAGs作为AI创业里一个重要的方向,也会在不久的将来,慢慢变成炮灰。

4、OpenAI即将关闭插件功能。
到这个时间点上,客观评价GPT商城已经可以完全取代插件功能了,插件功能被关闭也是预期之内。我本来想写一篇长一点的,专门讨论,想想,有些话题,在自媒体上,还是就到这个程度吧。其实,这背后体现出的是OpenAI面临越来越多的难题:
1)与开发者的关系,当初插件功能推出后,有开发者通过开发例如“MyPDF”这类的插件是挣到不菲的收入的,然后OpenAI支持了文件上传功能。虽然这件事情OpenAI迟早会做,但是毕竟“吃相”难看了。随着模型能力的不断提升,OpenAI不可能把各种“最后一公里”问题都解决。如果要构建所谓AI生态,某种程度上成为AI操作系统,那么与开发者之间的边界必须从一开始就划得很清楚,给予开发者足够的“安全感”。
2)商业化进程中,与微软的定位问题。除非微软全部押注在Azure云上,否则一个越来越商业化的OpenAI与产品线非常长的微软之间的竞争与冲突会越来越剧烈,放在2024年,矛盾公开的爆发,甚至都不是一个小概率事件。
最后,还是要说一下,我现在写东西,几乎都会选择戴上Vision Pro。每天包括看一些剧集的使用时间,加起来大概是三到四小时,单次尽可能控制在两小时以内,甚至一小时以内。
1)一旦体验了超大屏幕的感觉,就回不去了。
2)戴上眼镜,会更沉浸,效率提升是非常显著的。
3)戴上眼镜,暂时还不能扫二维码,所以,这个场景的未来,嘿嘿。
4)每天浏览一下应用商店,都会发现新的好玩的东西,都还不成熟,但是足够具备启发性,有些无论是作为程序员还是摄影师,抑或数据分析师,一直很难解决的痛点,让我看到了通过自己开发应用可以解决的可能性。
5)我用过的每一个优秀的产品都有这样的特点:一旦你接受了它的缺点,剩下的都是无法割舍的优点。