一个对话框、一只青蛙、一周4万用户，Ribbi做对了什么？

阿菜cabbage·2026年04月23日 08:30

不做Multi-Agent、不用“画布”，Ribbi的理念是：让Agent足够自由。

访谈｜邓咏仪周鑫雨

文｜周鑫雨

编辑｜杨轩

乍一使用，你很难给Ribbi一个准确的定义。

若说这是一个多模态内容创作工具，Ribbi能做得不止于此。比起一个“死”的工具，Ribbi更像一个可以自动管理创作全链路的“人”。

它能将用户的创作流程，自动沉淀为Skill；也能监测社交媒体的数据表现，总结复盘，并自动对后续的创作进行优化。

Ribbi官网首页。

对绝大多数创作者而言，这又是一个使用体验极度“陌生”的产品。区别于Figma、Lovart等设计产品，Ribbi没有醒目的画布，所有的创作、编辑交互，都集中在一个小小的对话框中。

而与你对话的Ribbi，被设定为一只个性十足的“青蛙”：爱吐槽，偶尔还能爆点粗口。

与Ribbi的对话。

这款有些“怪”的产品，却在上线封测一周内，收到了全球4万多用户的使用申请。用户群从上线第一天的20人，快速扩张成了20个几乎满员的大群。闲鱼上，Ribbi的内测码，一度被炒到了200元。

“我们上线Ribbi，本来是为了找100多个种子用户做封闭测试，验证PMF（产品-市场适配率），都没正式开始做营销和投放。”Ribbi创始人兼CEO Robin告诉我们，用户通过口碑传播的裂变速度，远超他的预期。

在4月初和《智能涌现》的交流中，Robin的嗓子已经哑了。半个月内，他见了多家投资机构，官方Linkedin的私信箱，也堆满了合作邀约。

毕业于工业设计专业，Robin做过4A和品牌企划，后续还在几家头部大厂，主导多款明星AI产品的创作功能设计、创意Agent落地等工作。

创业前，Robin就一直在探索：如何让创意实现的过程更简单。他发现，市面上的创作工具，都彼此独立，用户创作的上下文互不相通。这就导致，当用户要创作内容，每涉及一个环节，就要切换一款工具，还需要重新和工具对齐创作的需求。

“市面上不少AI设计工具，仍然把内容创作视作单点环节的拼接。但事实上，创作应该是涵盖创意生成、内容生成、发布、数据监测、复盘、优化的完整链路。”Robin告诉《智能涌现》。

基于这一认知，2025年末决定创业时，Robin做了不少“非共识”的决定：

不做Multi-Agent（多Agent架构）的产品，因为不同专家Agent在传递过程中，会造成Context的损耗；

不做单点的内容生成，而是用一个Agent，打通创作、发布、效果监测、复盘优化等创作中所有的链路；

不做“画布类”的产品，而是用Chat作为UI，给Agent更多的自由度；

自训VLM（视觉-语言模型）、自研名为Contxt Layer的Agent架构，沉淀创作经验和反馈，让AI自主进化。

这一切设计的最终目标，Robin告诉我们，是让Ribbi不仅仅局限于一个“工具”，而是成为理解完整创作闭环的“人”。

以下，是Ribbi创始人兼CEO Robin关于Agent创业的20条“暴论”：

🐸 大厂中，业务、模型和顶层之间的对齐是最困难的事，除非已经有业内共识。

比如，当Coding成为业内共识，不管是大厂，还是“AI六小虎”，都不约而同朝这个方向冲。

但在看到Taste的确切价值之前，为审美、品味构建模型，是大厂不愿意做的。只有当视觉创意生成从非共识，变成共识，才能激发更多大厂和顶尖人才参与进来。

🐸 一旦团队变大，对Context的折损就会增加。

大厂的基模能力很强，但模型团队对业务的认知有偏差。一旦团队变大，每个团队之间信息传递的过程，会折损大量的Context。

这也是Ribbi团队只有6个人的原因。我们只有3个程序员，他们现在是全栈设计师、全栈工程师，什么都能开发，并且可以做得很好。

这就是Claude Code带来的代码生产力的进化。我相信，Ribbi会带来内容生产力的进化。

🐸 很多AI产品都在虚假宣传。

我们在宣发的过程中搞了很多“抽象”，比如“72小时ARR破亿”“一夜百万用户”，本质上是为了讽刺很多AI产品的虚假宣传。

只是我们讽刺做得不够好，很多用户信以为真了（无奈笑）。

我们在X上的CEO账号也是虚假的，根本没有“Robin Bisset”这个人。账号上的很多内容，包括Robin的外国人形象，都是Ribbi生成的。

△Ribbi的虚拟老外CEO。图源：X

🐸 AI行业正在逐渐“币圈化”。

我花了很长时间才研究明白Harness。圈内很喜欢造概念，又是“马鞍”，又是“驾驭”，搞得很玄乎。

其实Harness很简单，就是一个脚本，或者一个workflow，让模型不偏离目标，更好地发挥价值。

在Harness这个概念出现之前，依靠框架或者Agent去优化AI执行任务的上下文，本身就是一个共识。如今行业只是把这件事抽象了出来，给了一个核心定义。

🐸 画布类的产品，把模型的可能性“锁死”了。

我们没有把Ribbi做成画布类的产品。画布类的AI产品看起来交互很酷炫，能让投资人眼前一亮，专业用户使用起来也很顺手。

但它们有一个“致命伤”：把模型的可能性提前“锁死”了。因为画布的本质，是将工作流拆成一个个节点，模型只能沿着这条路径走。

我们一直以来的判断是，AI时代的UI应该是容器化的，而不是功能化的。产品应该给AI创造一个容器，让它可以自由决定调用什么样的工具、怎么组合工具，甚至按照什么样的顺序执行任务。

🐸 具身智能成熟之前，Chat是AI最好的UI。

在互联网时代，我们就习惯通过Chat完成信息的传递，比如微信上可以拍图片、拍视频，也可以发链接、小程序。

在我看来，Chat是一个足够简单，并且灵活兼容一切的容器。

比如豆包DAU跑得很快，其中一个原因在于，它的移动端App设计得很轻量。用户不需要打开新的对话框，只要在一个session中疯狂Chat就能生图、生视频。它将用户的交互和AI的行为，统一在一个非常简单的框架中。

用户认为Ribbi好用的点，就在于他们可以随时把X、Instagram、Pinterest等平台上的素材，采集、保存在Ribbi中，底层的AI再自主学习其中的审美。这其实就是人与AI Chat的过程。

作为AI产品经理，我非常讨厌用复杂的交互去操作AI。AI应该很聪明，不用我时时刻刻盯着，就把活干了。当你产品的交互门槛、使用门槛足够低的时候，自然而然就能吸引更多人。

🐸 真实的创作需求从来不是单一维度的。

很多人会疑惑：为什么要往Ribbi里塞这么多功能（图片/视频/音乐创作、社交媒体监测、编辑器）？这样会不会导致定位模糊，或者每个功能都做不深？

我们一直认为，真正的创作需求从来不只有单一维度。比如一条抖音视频的制作，就涵盖了想选题、写文案、写脚本、生成分镜、配音、剪辑、编辑封面、发布、数据监测、复盘等流程。

这是一个完整的链路。没有All in one的工具意味着，用户需要切换不同的工具，重新对齐创作的上下文。

人一定是懒的动物。没有用户希望做一个产品、完成一个环节，就换一个模型、换一套工具。比如做一个视频，要先用ChatGPT生成文案，再用Gemini生成分镜，最后还要用剪映拼接视频，是很麻烦的。

我们设计Ribbi功能的出发点，不是为了把功能做全面，而是为了让创作链路的Context完整连通。

🐸 Ribbi构建Agent的核心在于自主进化。

互联网平台的核心是UGC，Ribbi的核心是AGC，Agent Generated Content。创业前，我就在寻找可以让“Agent自主进化”落地的场景，创作就是一个很好的答案。

首先，Taste会自主进化，这就是我们设计Pond和训练VLM的原因。

其次，Skills也会随着用户的使用自主进化。用户在使用Skill地过程中，会产生新的场景、需求和Context，这些Context就会凝练成专属用户个人的Skill。

这些个人Skill，都会经过Context Layer中的Skill Agent的评估、去重、去隐私化，再贡献给平台全端。因此，平台的Skill也会循环进化，用户使用越多，Skill就越多，能力也越强。

最后，用户的创作也会自主进化。我们建立完整创作工具的原因，就在于用户的创作是连续的过程，涵盖搜索、发现素材、生成内容、编辑优化、发布到社媒、数据监测等流程。

社交媒体，是Agent在线进化落地的核心训练场，将作品发布到社交媒体，是Agent与真实世界的一种交互。监测数据表现后，Ribbi能够自主迭代和优化创作路径，交付更好的结果。最终，平台就能够形成一个自主进化的创作闭环。

🐸 Multi-Agent本质上是对模型能力的低估，产品要让Agent更自由。

Multi-Agent架构中，大部分专家Agent的底层能力，都来源于Claude。既然底层模型一样，为什么还要通过提示词工程，把模型拆分成不同的Agent？

提示词工程，本质上是对模型能力的约束。与此同时，任务在多层Agent架构中的传递，都会造成Context的损耗。

我们做Ribbi的时候，核心观点是：让Agent足够自由。

Agent要在一个非常丰满、质量足够高的Context中，发挥自己的能力。因此，我们的核心架构其实是一条Single-Agent链路。

除此之外，我们构建了一个中间层，Context Layer。它由Memory、Taste 、Skills等不同层级构成，每一层都有对应的Agent。它们的作用不是执行任务，而是辅助Single-Agent收集Context。

这样做的好处是Single-Agent对上下文的感知不会折损，Token的损耗也会降低，这是我们的核心优势。与此同时，其他Agent又能补足一些上下文信息。

🐸 Ribbi不是OpenClaw的“套壳”，大家只是对Agent有相同的想象。

2025年11月，那时还没有OpenClaw，我就在公众号上写了一篇文章，构想了Agent发展的路径：第一，Agent会从被动，发展为更主动；第二，Agent的Context会不断自我进化。

这两点在OpenClaw上得到了具体的体现。但我们的产品定义和OpenClaw非常不一样：

首先我们提出了Context Layer，为Agent提供了很干净的Context；其次我们不希望为用户提供一个部署门槛很高的产品；最后我们整体的功能链路都是为内容创作服务，所以Ribbi提供了100多个可以自由组合、循环进化的Skills。

我相信世界上很多人对Agent的想象是一致的。OpenClaw很多的底层思考来源于Claude Code，我们的核心想象也出自Claude Code。

Claude Code为Agent创造了一个非常简洁的系统：Coding是Agent的环境，Function Call是Agent的手。Claude Code的出现让任何人可以成为全栈工程师，Ribbi的出现是让任何人能成为全栈的创作者。

🐸 我们不把Ribbi定义为“工具”，而是理解完整创作闭环的“人”。

首先，Ribbi是一个可以自我进化的内容引擎。其中，“Pond”是它的审美输入端，Skills是流程的沉淀，主动发布和数据监控是内容创作的最后一公里。

其次，我们希望Ribbi有活人感。如果你和Ribbi对话，就会发现ta是一只嘴上嘟囔、但会认真干活的青蛙。

🐸 Taste is all you need。

创作过程中最难用语言表达的，就是审美和品味。

为了解决审美建立的问题，我们为Ribbi设计了一个叫做“Pond”的板块。

用户在浏览Behance、Pinterest等设计平台时，可以通过Ribbi插件，将喜欢的设计采集并保存到Pond中。通过对Pond中资产的学习，Ribbi可以建立对用户审美的认知，未来创作的设计也会更符合用户的偏好。

除了学习用户个体的审美，Ribbi也会凝练平台所有用户的审美，成为平台共识。这么做的意义在于，让用户在不输入Prompt的情况下，也能获得高质量的设计。

支撑Ribbi学习、积累、迭代用户审美的核心，是我们基于开源的千问8B小模型训练的VLM（视觉-语言模型）模型。

它可以将图片、视频转化为文本Context，并将Context压缩进用于构建审美的Taste层，再基于Taste层生成新的设计。

对审美的不断沉淀，也是Ribbi产生用户粘性的核心。平台上，用户不断贡献新的审美Context，这些Context都会沉淀为Ribbi对你审美的认知。

在Pond中可以上传个人资产。

🐸 不能让模型，不知道你的操作。

目前，我对Ribbi主要有两个不满意的地方，一方面，稳定性还不够，包括性能和服务器、API负载；

另一方面，创作流程还不够灵活。因为没有编辑器，所以诸如“把字幕往上挪一点点”等简单调整，都需要用户去Chat。因此我们需要上线一些后编辑的功能。

但迭代的卡点在于，我们必须让底层模型知道用户的所有操作，对齐用户所有的上下文。只有这样，在后续创作过程中，Agent才能记住用户的偏好。

让模型感知到用户的后编辑，目前来看还有很高的开发门槛。

🐸 Ribbi的壁垒在于对技术的想象。

我们自主训练的VLM模型，目前多多少少算壁垒。当然，技术壁垒很容易被超越，Claude发布一个新模型可能就可以做到。

Ribbi的核心价值在于，我们不仅希望只做一家应用层的公司，而是在未做模型层的探索。训练VLM是现阶段探索的开始，包括中间层Context Layer的设计，都是基于我们对行业的Know-How和共识去完成的，

这些事说出来其实不难，难的是把它想象出来。所有的事最重要的就是想象，而我们是第一个把技术领域的AI自主进化想象、并且落地的团队。而且我们对Agent的认知一直在往前走，这是我们的想象保持领先性、建立壁垒的前提。

🐸 把Token消耗转化为扣积分的商业模式，不够诚实清晰。

我们的商业化会做得比较诚实。虽然模式还没完全确定，但一定不会是积分制。

△Ribbi会显示每个环节消耗的Token量。图源：作者试用

不少AI产品会采用积分发放的方式。个人觉得挺绕，用户还得把积分转化为Token消耗量，不够清晰。

也有平台会告诉你，“充值一次，无限Token”，但实际上用户天天在排队。这样的商业模式不诚实，而且平台还会亏本。

🐸 好的内容平台应该有广告。

我最近也在研究一些好的内容平台的商业模式。YouTube几乎是免费的，因为有足够多的广告商在视频中分发贴片广告。

广告的好处在于，让平台把用户的成本转嫁给广告商，同时也让创作者通过广告，有直接的收入，从而激励他们在平台上的创作。

🐸 Ribbi的北极星指标，是Skill的增长。

目前，网站上有20多个Skill，其实我们内部已经有100多个Skill，比如一键消除、做PPT等技能。没有放出来的核心原因在于，我们的设计师对审美的要求很高。

所以我们的北极星指标是不断裂变出更多高质量、高审美的Skill。

并且我们不希望Ribbi成为一个工具集。工具聚合网站，更像是一个个的小程序，它们之间是相互独立、互不连通的状态。

但我们的Skill会在同一个Single-Agent中连通。这样的好处是Agent可以在接管创作全流程中，灵活串联不同的Skill。

另一点，我也希望Ribbi上的工具数量能不断增长。目前我们的100多个Skill，靠的是100多个工具的不同组合。一旦我们的工具数量扩大到1000多个，Skill会进化产生我们想象不到的价值。

△Ribbi上沉淀的Skills。图源：Ribbi官网

🐸 应用公司探索模型层是有必要的。

只有自己亲身训练和使用，才能知道当下模型的限制，以及实现AI自主进化的逻辑路径。我们现在实现AI自主进化的路径，是基于Context实现的。

但未来，自主进化一定会在模型层上实现，并且会有非常多的人探索。自己训练模型，是为了提前积累经验。

🐸 我们不把自己定义为创业团队，而是独立开发者的组织。

我们不会像某些友商那样，不断花钱买量、烧各种补贴。我们不想做一家为估值而奋不顾身的公司。

融资当然也很重要。你要确保账上有足够的资金，去支撑研发-获得用户反馈-迭代的循环。

我们现在正在推进下一轮融资，并非是有意的，而是如今Ribbi获得的用户声量，远超我们的预期。现在的状态，有点像时代推着你往前走。

我们收到了很多投资意向书，但我希望愿意投资我们的机构，是真正对AI有价值判断的、长期看好AI的自主进化，而不是出于FOMO（错失恐慌）。

🐸 我立志成为硅基生命的垫脚石。

我们一直在找一个符号表达“自主进化”的理念。Ribbi LOGO是一只青蛙的原因，是因为蝌蚪进化为青蛙是一种非线性的变态发育，“Ribbi”就是呱呱叫（ribbit）的拟声词。

我相信AGI一定会到来。无论是训练模型，还是做Context Layer，这些看起来“很重”的事，目的都是为了加快AGI到来的进程，哪怕只留下一点点痕迹。

假设某一天，某家模型厂商实现了AI的自主进化，即便功不在我，我愿意贡献我们对Context Layer自主进化的Know-How、开源我们的技术架构，帮助模型厂商训练更好的自主进化模型。

欢迎交流！

本文由「阿菜cabbage」原创出品，转载或内容合作请点击转载说明；违规转载必究。

寻求报道