如之前文章介绍,使用Gemini的最新Vibe Coding应用:AI Studio中的Build,开发各种小工具已经有不短的一段时间了。
这两天,我终于想通了各种工具统一后台的解决方法,并在Cloudflare上部署成功后,决定将后台和各应用逐步开放出来。
今天,第一个开放的是对我而言挺有意义的工具,花式P图工具,bipolar-banana,当然,对我有意义的不仅仅是因为P图能力,还因为在前段时间状态最差的时候,它治愈了我。
一部分一部分来,首先,是统一后台fabric-worker:https://github.com/dmquant/fabric
架构很简单,就是通过Cloudflare Worker统一管理关系数据库D1和对象数据库R2。其实,关于一个后台的想法我设计并尝试了很久,用了很多方案。
起了很多个名字,最接近完美的版本叫做ai-factory,几乎上了Cloudflare在存储方面全家桶。然而,它完美到很难在上面加应用。

突然的开窍来自于反其道而行,极简。

很有意思,我每一个满意的使用AI的作品,都是“极简”的,如果我们相信模型的能力,或许就该如我昨天写google的文章一样,模型+存储。而存储,只要是存储就可以了,我们甚至于不需要进行标准化,结构化,保持其原样就可以。因为最重要的两点是:存下来,以及,相信模型一直在进步。
所以,数据结构也是简单的,关系型数据库只有三张表:sessions, logs, assets。分别代表what, how, where。

只有一种对象类型:对应应用的所有输出,不管是什么格式,文本也好,图片也好,代码也好,音频也好,二进制文件也好……

然后在build中给予每一个app统一的后台:

多说一句,为什么Cloudflare?它是目前为止我用过的最完整,最容易上手,开发效率最高的全栈工具:安全,网站及域名管理,网页托管,数据存储,以及在此之上无所不能的Worker。有时间,我可以单独完整的介绍一下Cloudflare,以及为什么我认为它会成为AI时代非常重要的基础设施。
它不是SaaS,不是IaaS,不是Paas,不是MaaS,又全都是。是EaaS,Everything as a Service。
说完后台worker(在项目的worker子目录下的README文件有详细的部署介绍),进入主角,bipolar banana。

如今我几乎每天还在改进bipolar-banana,它已经成为我每日离不开的P图工具了。它也早已不是最早那个发泄情感的工具了。

而是赋予了对我很实用的功能,比如室内装修(很杀API额度,慎用,或许未来我会想着如何改进一下workflow)。

比如风格化照片(24种风格),以及智能风格。

还用它来建一些三维场景。不过这两天可能是因为Gemini更新,代码方面有些小问题,该功能暂时被我移调了,改成p5.js了。

当然,我最常用的场景是两个:一是隐私处理,我如今拍摄了大量的人文照片,但是太多的真实人脸不仅让我无法分享,更多时候也让我自己觉得不适,P图可以很自然的替换人脸;二是为视频生成提供图片素材。

而两者结合就是我昨天发的视频。
其实,也许,这些图片代表的平行世界也是真实存在的,谁又能说不是呢?

Bipolar_banana被我作为submodule加到了fabric项目下。
第一个应用分享完毕,虽然我并非很在意文章阅读量(在意,但不是很在意),但今天想尝试一些新方法,为下一个应用的分享设定开启条件:OR(阅读量10K+,赞50+,转发200+)。
计划中下一个分享的应用:每天用的报告可视化自动播报。
