不到 3 个月估值破 40 亿,Fal.ai CEO:模型越多,我们越值钱
2025 年 10 月 22 日,AI 基础设施公司 Fal.ai宣布完成新一轮 2.5 亿美元融资。据悉,凯鹏华盈与红杉资本领投此轮,公司估值超40亿美元。
距离上一轮 15 亿美元估值的 C 轮融资,还不到 3 个月。
这家不足 50 人的初创公司,没有训练任何自研大模型,也不追逐最强参数。
它只做一件事:让模型能调用、可商用。
Fal.ai 联合创始人兼 CEO Gorkem Yurtseven 在随后的专访中这样定义自己:
不再比拼模型能力,而是让任何模型都能被开发者用起来。模型越多,我们的平台就越有价值。
18个月前,他们还在做数据基础设施工具,为大公司处理数据清洗与转换。
直到Stable Diffusion爆火,他们看到底层逻辑变了:过去是训练模型难,现在是模型太多,反而没人能用好。他们砍掉付费产品,把模型当原料,把推理变成流水线。
(来源TechCrunch :Fal.ai完成新一轮融资,估值超40亿美元)
今天,Fal平台托管 600 多个模型,服务超过 200 万开发者。 Adobe、Canva、Shopify、Perplexity 已将它作为生成式媒体的基础设施。
这家公司不讲“AGI对齐”,不靠“论文发布会”破圈。
但它抓住了一个关键问题:当模型爆炸后,谁来承接落地?
答案就在 Gorkem Yurtseven 这场访谈里。
第一节|不是做模型,做模型的“加油站”:Fal 押对了什么?
Fal 是怎么起步的?
2022 年,,他们还在做一个给数据团队用的工具,主要帮企业清洗数据、处理管道。有客户,有营收,有投资人支持。
但 Fal 创始人 Gorkem Yurtseven 说:我们决定放弃所有已有客户,全力转向模型推理。
这背后是一个清晰的判断:真正爆发的,不是模型训练,而是模型被调用。
Fal 做出转型时,正是 Stable Diffusion 爆红的时期。随后,OpenAI 的 ChatGPT、DALL·E 2、Sora 接连上线。
过去要用 AI,你得先训练模型,得有自己的大数据。现在不一样了,模型已经训练好了,你只要能接入,就能做出产品。
Gorkem 回忆,他们当时问自己一个关键问题:
哪个方向能让我们最快做到 100 万美金收入?哪个能最快到 1000 万?
他们的回答:不是做一个新模型,而是做一个能让任何模型直接上线的平台。
市场信号很明显:
- 每当一个新模型发布,就有很多人想用;
- 但这些人要么缺 GPU,要么不知道怎么部署;
- 模型作者也不知道怎么做 API 或运维。
Fal 做的就是让模型从实验室到产品之间那一步,变得特别快。
他们最早支持的,是 Stable Diffusion。后来是 Flux 视频模型。 再后来,几乎所有主流开源多模态模型,他们都能做到发布当天就接入。
Gorkem 这样形容:
“每个人都想一遍又一遍地做差不多的事情,那我们就把最常见的用法做好,让人一用就能上手。”
今天,Fal 已经成了多模态模型发布的首发平台之一。只要一个模型能生成图片、视频或音频,就能在 Fal 上被调用、被试用、被接入企业产品。
不是造引擎,而是造“加油站”。
这个判断,是他们三轮融资、估值翻倍的第一步。
第二节|没有GPU优势,如何跑出速度优势?
Fal 最出圈的不是融资新闻,而是在硅谷的两顶帽子。
一顶印着“GPU 富人”,另一顶印着“GPU 穷人”。结果,“GPU 穷人”那顶最先被抢光了。
这是玩笑,也是真实写照。Gorkem 说:当时 GPU 抢不到,我们就开始疯狂优化每一次模型调用的速度。我们不是资源多,而是用得省、调得快。
他说,他们的核心目标只有一个:
让每一次模型调用,尽可能快、尽可能稳、尽可能便宜。
这不是简单压成本,而是把整个模型运行过程,当作一条“产线”去调试。
Fal 最早优化的是 Stable Diffusion 模型。他们有个只有两人的工程小组,一人擅长写底层代码,一人精通 GPU 指令。他们每天就做一件事:找哪里还能省时间,哪里还能提速。
Gorkem 说:我们不研究模型怎么更聪明,而是研究怎样运行的更快。
他们做到了:同样一张图片生成,从几十秒缩短到几秒以内;视频模型的推理时间也压到了行业最低。
怎么做到的?
- 模型冷启动慢?那就提前缓存;
- GPU 分配混乱?那就按模型热度智能调度;
- 多个模型抢资源?那就建 28 个节点,把流量分开。
Fal 不是堆硬件,而是把模型当作工序管理起来,像流水线一样高效调配。
Gorkem 强调,这一切的关键,是他们坚持自己部署模型、自己控制 API,不让客户“上传自己的代码”:我们不做开放式平台,而是把常用的功能打包成一套通用接口,做到即插即用、快速响应。
Fal的产品逻辑很清晰:不是让你自由搭建,而是可以直接调用。
他们的模型平台像一个中控室,600 多个图像、视频、音频模型随时待命。客户发起请求后,系统会在最合适的节点、用最少的时间给出结果。
凭借这一点,他们后来服务了上百万开发者,支持了Adobe、Shopify等大企业。
第三节|技术不是壁垒,入口才是
Fal 一开始的客户,大多是个人开发者。没预算、没团队,甚至没有 GPU。
但这些人,一上线就愿意花钱。
Gorkem 回忆:
我们看到一些用户每天在平台上花几千甚至几万美元。那时候我们就知道,这不是玩具。
这些客户不是为了测试模型,而是要上线产品。哪怕模型本身是开源的,他们也不想花时间自己部署。
他们只想要一个API,可以直接调用、稳定输出、不掉链子。
这就是 Fal 的切入点:不是提供最强模型,而是把最常用的模型封装成一键可用的工具。
用 Stable Diffusion 生成图片,Fal 提供的是已经打包好的推理接口;
想用 Flux 视频模型,也不需要下载模型、配置环境,只需要接一个 API;
平台会自动调配 GPU、提前加载模型,确保你发请求后能立即拿到结果。
Gorkem 明确表示:
“我们不是做一个大家都能自定义的托管服务,而是做一套响应快、能落地、能商用的推理平台。”
不给太多自由,而是把最复杂的部分替你做好。
客户不关心模型是谁训练的,只关心能不能准时返回结果、价格可不可控、接入后会不会出问题。
一旦接入了,就懒得换。
Fal 不靠单个模型绑定用户,而是靠平台的整体体验:快速上线、接口统一、模型自动更新、稳定可靠。
就像 AWS 的S3,关键不是技术最复杂,而是让开发者用得省事、用得放心。
Fal 把模型变成服务,把模型的“入口体验”变成了自己的产品。每次有新模型发布,Fal 的第一反应不是看论文,而是:怎么把它接入平台,三小时内上线?
Gorkem 说得非常具体:
“我们会开一个 Slack 群通话,七八个人一起在线调模型。有人调代码,有人分享屏幕,有人在测接口。我们甚至把这个过程直播过。”
这就是 Fal 独有的节奏。
不是把模型做得多复杂,而是谁能最快让别人用起来。
第四节|多模态越来越碎片,平台反而更值钱
过去几年,AI 领域有个主旋律:谁训练模型,谁掌握未来。
但到了 2025 年,多模态模型的玩法变了。
Gorkem Yurtseven 的判断是:现在每周都有三五个模型发布,开发者已经跟不上了。
这一波爆发,不是靠一个超级模型,而是大量开源、多样化、用途细分的模型一起涌现。
- 有的专门生成图片;
- 有的只做 4 秒视频;
- 有的专攻 3D 动作捕捉;
- 还有的是声音合成、配乐生成…
它们都很好用,但格式不一样、调用方式不同,速度也参差不齐。从架构到接口,每个模型功能都差不多。结果就是:
- 研究院做出了好东西,没人能用;
- 开发者想用新模型,却不知道去哪找、怎么部署;
- 企业想买服务,但缺少一个靠谱的平台去对接。
而 Fal 抓住了这个机会。
Gorkem 的思路很清晰:
模型越多、越分散、越碎片化,我们就越值钱。因为只有平台才能把它们整合、优化、让人用起来。
Fal 做的事情,可以理解成:
帮开发者一口气接入 600 个模型,不用来回换接口;
帮企业绕开兼容难题,直接用一套方案统一接入;
帮模型作者在平台上发布和上线,无需自己建服务器。
就像当年浏览器统一了网站入口、电商平台统一了商品入口,Fal 正在统一模型入口。
更重要的是,这是长期趋势。
Gorkem 指出: “模型不会只有一个官方版本。只要能被修改和复制,就会出现无数个针对不同场景的优化版本。”
这意味着:
- 大模型的“唯一权威”地位正在弱化;
- 开源社区、创业公司、研究院都会发布自己的版本;
- 市场将变成百花齐放、版本混杂的局面。
这时候,基础设施比模型本身更值钱。
这正是Fal能在三个月内估值暴涨的关键。当 Sora 等视频应用爆火时,Fal 作为底层基础设施,自然成为最大的受益者之一。
第五节|45人,1亿美金:小团队如何跑出大效率?
Fal 的团队规模,一直让人意外。
2025 年,他们年营收超过 1 亿美元,客户包括 Adobe、Shopify、Perplexity 等大企业。
但整个公司不到 50 个人。
Gorkem 说得特别实在:我们没有工程经理,全员写代码,连领导也自己上手干。他们没有层级、没有流程汇报,也不搞例会。他们更愿意拉个三四人的小群,直接在线上把事情解决。
他们的做法是:有问题就拉个三四人的小群,直接在线上解决。
看起来松散,但效率极高。
在Fal,团队不追求计划精细,而是盯住模型热度,随时准备快速上线。
Gorkem 形容他们:新模型只要有潜力,就全员动手,像战备状态。这套机制的关键,不是人多,而是方向聚焦。
他说:
“我们只有一个核心目标:收入增长。只要对这件事有帮助,其他都靠后”
在早期,Fal 连销售团队都没有,只有创始人亲自谈客户。很多企业用户都是从平台自然转化来的。
举个例子:
开发者在平台上用API做应用,月支出到了几千美元;
系统监测到活跃度,自动提醒销售;
销售介入,提供年合约、价格优惠、定制支持。
这不是传统 SaaS 公司那套销售流程,而是靠平台本身的自然增长。
他们内部有个简单指标:日支出超过 300 美元的客户,就自动进入销售转化池。
这让他们能用极少的销售人手,完成大体量的客户覆盖。到今天,销售和客户支持团队也只有十来个人。
Fal 的高效,不只是业务策略,更是文化基因。
他们对招聘极度谨慎。
“我们不会因为有钱就招人,也不会为了快扩张就上项目。”
Gorkem 坦言,他们早期招的很多人,都来自老同事、朋友、活跃在社区的开发者。有的在硅谷大厂,有的还在土耳其,但都愿意动手、愿意深入调模型。
模型还没火,就已经准备上线;
客户还没找上门,就已经在平台消费;
团队还没扩张,产品已经做到最前线。
不是靠大预算堆出来的,而是把每一分人力、技术和资源都花在最关键的地方。
结语|模型只是原料,平台才是出口
Fal.ai 没有训练自己的大模型,没有开源权重,也没有发布任何技术论文。
但它成为了估值超40亿美元的公司。
原因只有一个:当模型越来越多,真正稀缺的是谁能让它们被用起来。
Gorkem说过一句话: "别人讲 AGI,我们做的是 API。"
几乎同时,据媒体报道,国内 AI 应用公司 LiblibAI 完成 1.3 亿美元 B 轮融资。
应用层 AI 公司在爆发,基础设施层在狂奔。
接下来的竞争不再是谁的模型更强,而是谁能成为所有模型的首发平台、所有开发者的必选入口。
多模态商业化的下半场,刚刚开始。
📮参考资料
https://www.youtube.com/watch?v=e_AG1c4w138&t=153s
https://techcrunch.com/2025/10/21/sources-multimodal-ai-startup-fal-ai-already-raised-at-4b-valuation/
https://blog.fal.ai/series-c/
https://review.firstround.com/podcast/the-pivot-that-paid-off-how-fal-found-explosive-growth-in-generative-media-gorkem-yurtseven-co-founder-and-ceo/
https://www.businesswire.com/news/home/20250731234742/en/fal-Raises-%24125M-in-Series-C-Led-by-Meritech-with-Salesforce-Ventures-Shopify-Ventures-and-Google-AI-Futures-Fund-Joining-to-Power-the-Next-Decade-of-Generative-Media/
本文来自微信公众号“AI 深度研究员”,作者:AI深度研究员,36氪经授权发布。















