不到 3 个月估值破 40 亿，Fal.ai CEO：模型越多，我们越值钱

AI深度研究员·2025年10月24日 08:54

Fal.ai融资2.5亿美元，估值超40亿，专注模型调用平台。

2025 年 10 月 22 日，AI 基础设施公司 Fal.ai宣布完成新一轮 2.5 亿美元融资。据悉，凯鹏华盈与红杉资本领投此轮，公司估值超40亿美元。

距离上一轮 15 亿美元估值的 C 轮融资，还不到 3 个月。

这家不足 50 人的初创公司，没有训练任何自研大模型，也不追逐最强参数。

它只做一件事：让模型能调用、可商用。

Fal.ai 联合创始人兼 CEO Gorkem Yurtseven 在随后的专访中这样定义自己：

不再比拼模型能力，而是让任何模型都能被开发者用起来。模型越多，我们的平台就越有价值。

18个月前，他们还在做数据基础设施工具，为大公司处理数据清洗与转换。

直到Stable Diffusion爆火，他们看到底层逻辑变了：过去是训练模型难，现在是模型太多，反而没人能用好。他们砍掉付费产品，把模型当原料，把推理变成流水线。

（来源TechCrunch ：Fal.ai完成新一轮融资，估值超40亿美元）

今天，Fal平台托管 600 多个模型，服务超过 200 万开发者。 Adobe、Canva、Shopify、Perplexity 已将它作为生成式媒体的基础设施。

这家公司不讲“AGI对齐”，不靠“论文发布会”破圈。

但它抓住了一个关键问题：当模型爆炸后，谁来承接落地？

答案就在 Gorkem Yurtseven 这场访谈里。

第一节｜不是做模型，做模型的“加油站”：Fal 押对了什么？

Fal 是怎么起步的？

2022 年，，他们还在做一个给数据团队用的工具，主要帮企业清洗数据、处理管道。有客户，有营收，有投资人支持。

但 Fal 创始人 Gorkem Yurtseven 说：我们决定放弃所有已有客户，全力转向模型推理。

这背后是一个清晰的判断：真正爆发的，不是模型训练，而是模型被调用。

Fal 做出转型时，正是 Stable Diffusion 爆红的时期。随后，OpenAI 的 ChatGPT、DALL·E 2、Sora 接连上线。

过去要用 AI，你得先训练模型，得有自己的大数据。现在不一样了，模型已经训练好了，你只要能接入，就能做出产品。

Gorkem 回忆，他们当时问自己一个关键问题：

哪个方向能让我们最快做到 100 万美金收入？哪个能最快到 1000 万？

他们的回答:不是做一个新模型，而是做一个能让任何模型直接上线的平台。

市场信号很明显：

每当一个新模型发布，就有很多人想用；
但这些人要么缺 GPU，要么不知道怎么部署；
模型作者也不知道怎么做 API 或运维。

Fal 做的就是让模型从实验室到产品之间那一步，变得特别快。

他们最早支持的，是 Stable Diffusion。后来是 Flux 视频模型。再后来，几乎所有主流开源多模态模型，他们都能做到发布当天就接入。

Gorkem 这样形容：

“每个人都想一遍又一遍地做差不多的事情，那我们就把最常见的用法做好，让人一用就能上手。”

今天，Fal 已经成了多模态模型发布的首发平台之一。只要一个模型能生成图片、视频或音频，就能在 Fal 上被调用、被试用、被接入企业产品。

不是造引擎，而是造“加油站”。

这个判断，是他们三轮融资、估值翻倍的第一步。

第二节｜没有GPU优势，如何跑出速度优势？

Fal 最出圈的不是融资新闻，而是在硅谷的两顶帽子。

一顶印着“GPU 富人”，另一顶印着“GPU 穷人”。结果，“GPU 穷人”那顶最先被抢光了。

这是玩笑，也是真实写照。Gorkem 说：当时 GPU 抢不到，我们就开始疯狂优化每一次模型调用的速度。我们不是资源多，而是用得省、调得快。

他说，他们的核心目标只有一个：

让每一次模型调用，尽可能快、尽可能稳、尽可能便宜。

这不是简单压成本，而是把整个模型运行过程，当作一条“产线”去调试。

Fal 最早优化的是 Stable Diffusion 模型。他们有个只有两人的工程小组，一人擅长写底层代码，一人精通 GPU 指令。他们每天就做一件事：找哪里还能省时间，哪里还能提速。

Gorkem 说：我们不研究模型怎么更聪明，而是研究怎样运行的更快。

他们做到了：同样一张图片生成，从几十秒缩短到几秒以内；视频模型的推理时间也压到了行业最低。

怎么做到的？

模型冷启动慢？那就提前缓存；
GPU 分配混乱？那就按模型热度智能调度；
多个模型抢资源？那就建 28 个节点，把流量分开。

Fal 不是堆硬件，而是把模型当作工序管理起来，像流水线一样高效调配。

Gorkem 强调，这一切的关键，是他们坚持自己部署模型、自己控制 API，不让客户“上传自己的代码”：我们不做开放式平台，而是把常用的功能打包成一套通用接口，做到即插即用、快速响应。

Fal的产品逻辑很清晰：不是让你自由搭建，而是可以直接调用。

他们的模型平台像一个中控室，600 多个图像、视频、音频模型随时待命。客户发起请求后，系统会在最合适的节点、用最少的时间给出结果。

凭借这一点，他们后来服务了上百万开发者，支持了Adobe、Shopify等大企业。

第三节｜技术不是壁垒，入口才是

Fal 一开始的客户，大多是个人开发者。没预算、没团队，甚至没有 GPU。

但这些人，一上线就愿意花钱。

Gorkem 回忆：

我们看到一些用户每天在平台上花几千甚至几万美元。那时候我们就知道，这不是玩具。

这些客户不是为了测试模型，而是要上线产品。哪怕模型本身是开源的，他们也不想花时间自己部署。

他们只想要一个API，可以直接调用、稳定输出、不掉链子。

这就是 Fal 的切入点：不是提供最强模型，而是把最常用的模型封装成一键可用的工具。

用 Stable Diffusion 生成图片，Fal 提供的是已经打包好的推理接口；

想用 Flux 视频模型，也不需要下载模型、配置环境，只需要接一个 API；

平台会自动调配 GPU、提前加载模型，确保你发请求后能立即拿到结果。

Gorkem 明确表示：

“我们不是做一个大家都能自定义的托管服务，而是做一套响应快、能落地、能商用的推理平台。”

不给太多自由，而是把最复杂的部分替你做好。

客户不关心模型是谁训练的，只关心能不能准时返回结果、价格可不可控、接入后会不会出问题。

一旦接入了，就懒得换。

Fal 不靠单个模型绑定用户，而是靠平台的整体体验：快速上线、接口统一、模型自动更新、稳定可靠。

就像 AWS 的S3，关键不是技术最复杂，而是让开发者用得省事、用得放心。

Fal 把模型变成服务，把模型的“入口体验”变成了自己的产品。每次有新模型发布，Fal 的第一反应不是看论文，而是：怎么把它接入平台，三小时内上线？

Gorkem 说得非常具体：

“我们会开一个 Slack 群通话，七八个人一起在线调模型。有人调代码，有人分享屏幕，有人在测接口。我们甚至把这个过程直播过。”

这就是 Fal 独有的节奏。

不是把模型做得多复杂，而是谁能最快让别人用起来。

第四节｜多模态越来越碎片，平台反而更值钱

过去几年，AI 领域有个主旋律：谁训练模型，谁掌握未来。

但到了 2025 年，多模态模型的玩法变了。

Gorkem Yurtseven 的判断是：现在每周都有三五个模型发布，开发者已经跟不上了。

这一波爆发，不是靠一个超级模型，而是大量开源、多样化、用途细分的模型一起涌现。

有的专门生成图片；
有的只做 4 秒视频；
有的专攻 3D 动作捕捉；
还有的是声音合成、配乐生成…

它们都很好用，但格式不一样、调用方式不同，速度也参差不齐。从架构到接口，每个模型功能都差不多。结果就是：

研究院做出了好东西，没人能用；
开发者想用新模型，却不知道去哪找、怎么部署；
企业想买服务，但缺少一个靠谱的平台去对接。

而 Fal 抓住了这个机会。

Gorkem 的思路很清晰：

模型越多、越分散、越碎片化，我们就越值钱。因为只有平台才能把它们整合、优化、让人用起来。

Fal 做的事情，可以理解成：

帮开发者一口气接入 600 个模型，不用来回换接口；

帮企业绕开兼容难题，直接用一套方案统一接入；

帮模型作者在平台上发布和上线，无需自己建服务器。

就像当年浏览器统一了网站入口、电商平台统一了商品入口，Fal 正在统一模型入口。

更重要的是，这是长期趋势。

Gorkem 指出： “模型不会只有一个官方版本。只要能被修改和复制，就会出现无数个针对不同场景的优化版本。”

这意味着：

大模型的“唯一权威”地位正在弱化；
开源社区、创业公司、研究院都会发布自己的版本；
市场将变成百花齐放、版本混杂的局面。

这时候，基础设施比模型本身更值钱。

这正是Fal能在三个月内估值暴涨的关键。当 Sora 等视频应用爆火时，Fal 作为底层基础设施，自然成为最大的受益者之一。

第五节｜45人，1亿美金：小团队如何跑出大效率？

Fal 的团队规模，一直让人意外。

2025 年，他们年营收超过 1 亿美元，客户包括 Adobe、Shopify、Perplexity 等大企业。

但整个公司不到 50 个人。

Gorkem 说得特别实在：我们没有工程经理，全员写代码，连领导也自己上手干。他们没有层级、没有流程汇报，也不搞例会。他们更愿意拉个三四人的小群，直接在线上把事情解决。

他们的做法是：有问题就拉个三四人的小群，直接在线上解决。

看起来松散，但效率极高。

在Fal，团队不追求计划精细，而是盯住模型热度，随时准备快速上线。

Gorkem 形容他们：新模型只要有潜力，就全员动手，像战备状态。这套机制的关键，不是人多，而是方向聚焦。

他说：

“我们只有一个核心目标：收入增长。只要对这件事有帮助，其他都靠后”

在早期，Fal 连销售团队都没有，只有创始人亲自谈客户。很多企业用户都是从平台自然转化来的。

举个例子：

开发者在平台上用API做应用，月支出到了几千美元；

系统监测到活跃度，自动提醒销售；

销售介入，提供年合约、价格优惠、定制支持。

这不是传统 SaaS 公司那套销售流程，而是靠平台本身的自然增长。

他们内部有个简单指标：日支出超过 300 美元的客户，就自动进入销售转化池。

这让他们能用极少的销售人手，完成大体量的客户覆盖。到今天，销售和客户支持团队也只有十来个人。

Fal 的高效，不只是业务策略，更是文化基因。

他们对招聘极度谨慎。

“我们不会因为有钱就招人，也不会为了快扩张就上项目。”

Gorkem 坦言，他们早期招的很多人，都来自老同事、朋友、活跃在社区的开发者。有的在硅谷大厂，有的还在土耳其，但都愿意动手、愿意深入调模型。

模型还没火，就已经准备上线；

客户还没找上门，就已经在平台消费；

团队还没扩张，产品已经做到最前线。

不是靠大预算堆出来的，而是把每一分人力、技术和资源都花在最关键的地方。

结语｜模型只是原料，平台才是出口

Fal.ai 没有训练自己的大模型，没有开源权重，也没有发布任何技术论文。

但它成为了估值超40亿美元的公司。

原因只有一个：当模型越来越多，真正稀缺的是谁能让它们被用起来。

Gorkem说过一句话： "别人讲 AGI，我们做的是 API。"

几乎同时，据媒体报道，国内 AI 应用公司 LiblibAI 完成 1.3 亿美元 B 轮融资。

应用层 AI 公司在爆发，基础设施层在狂奔。

接下来的竞争不再是谁的模型更强，而是谁能成为所有模型的首发平台、所有开发者的必选入口。

多模态商业化的下半场，刚刚开始。

📮参考资料

https://www.youtube.com/watch?v=e_AG1c4w138&t=153s

https://techcrunch.com/2025/10/21/sources-multimodal-ai-startup-fal-ai-already-raised-at-4b-valuation/

https://blog.fal.ai/series-c/

https://review.firstround.com/podcast/the-pivot-that-paid-off-how-fal-found-explosive-growth-in-generative-media-gorkem-yurtseven-co-founder-and-ceo/

https://www.businesswire.com/news/home/20250731234742/en/fal-Raises-%24125M-in-Series-C-Led-by-Meritech-with-Salesforce-Ventures-Shopify-Ventures-and-Google-AI-Futures-Fund-Joining-to-Power-the-Next-Decade-of-Generative-Media/

本文来自微信公众号“AI 深度研究员”，作者：AI深度研究员，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。