梁文锋，真是人间清醒

硬核看板·2026年07月02日 09:48

君子论迹不论心，圣人也一样。

这个周末，DeepSeek又闷声放了个大的。

他们把给V4提速的技术DSpark连同训练/评测工具箱DeepSpec（含论文和三种算法）一起开源丢上了GitHub，又把"挂了提速模块的V4权重"（V4-Pro-DSpark、V4-Flash-DSpark）丢上了AI模型开源社区Hugging Face。全部MIT许可（一种最宽松的开源许可证）、免费可商用。

一时间，整个互联网又炸了。小红书上，有人发帖称“梁圣的恩情，还不完了”；有人喊他活菩萨，有人说他一个人扛起了整个开源圈的脸面。

海外一位常年盯着中国大模型的博主Teortaxes甚至直呼，DeepSeek开源DeepSpec是“出于浩瀚的慷慨”。（Out of their vast goodwill, they also open source DeepSpec: "a codebase for training and evaluating draft models for speculative decoding）

到底梁文锋有多伟大，才称得上这一个“圣”字？

告诉世界，什么叫真正的开源

和全球的大厂对比一下你就知道DeepSeek有多慷慨。

先说OpenAI，名字里就带着“Open”，可它早名不副实了。原本OpenAI是一个公益向的项目，当时联合创始人山姆·奥特曼（Sam Altman）觉得：既然AI的到来不可避免，那我就先去创造出来，然后自己去定义这个行业。结果随着马斯克退出、微软注资商业化转型，OpenAI已经Open不起来了。

2023年它发布当家模型GPT-4时，配套的技术报告里干脆写明：出于竞争考虑，不透露任何技术细节。连模型多大、怎么搭的都不告诉你。

到了2025年，DeepSeek用开源且便宜得多的模型把整个行业震了一下（后面会讲），OpenAI眼看免费的中国开源模型就要成为全世界程序员的默认选择，慌了，才在2025年8月赶忙放出一个叫gpt-oss的开源模型救场。

奥特曼后来都认了：“我们之前站在了历史错误的一边。”可即便这个gpt-oss，也只给了模型本身，训练用的代码和数据照样藏着掖着。

Meta的Llama模型看着最开放，许可证里却全是小字陷阱：你的产品月活用户超过7亿，就得另外找Meta掏钱买授权，给不给“全看它心情”。

专门给开源立规矩的机构、开源促进会OSI（Open Source Initiative），两次公开点名“Llama根本不算开源”，还叫他们是open washing，意思是“假装开源、洗个好名声”。

至于Anthropic，到今天一个开放模型都没放出来过，是AI圈最封闭的一个，他们的理由全是“为了安全”。CEO达里奥·阿莫代伊（Dario Amodei）明牌反华，公开主张美国要卡死对华的AI芯片出口，害怕自己“被中国追上”。

更恶劣的是，这帮把门焊死的，反过来一个个指控DeepSeek“偷”（准确说是“蒸馏”）了自己的模型。

蒸馏，就是拿别人模型的回答来训练自己的小模型，相当于偷师解题过程。2025年初DeepSeek刚火，OpenAI就放话说DeepSeek“有迹象”不当蒸馏了自家模型；白宫方面的负责人大卫·萨克斯（David Sacks）更在电视上说“有实质证据”，最后反正没拿出来。

一年后，Anthropic也下场了，指控DeepSeek等三家中国公司用2.4万个假账号、跟Claude聊了1600多万次，“工业级”地套它的本事。

DeepSeek既没承认、也没否认。

但模型作为一种知识的归纳提炼，很难说是谁的。康奈尔大学讲师卢茨·芬格（Lutz Finger）说：大厂当年拿《纽约时报》、福布斯的文章去喂自己的模型时，可没问过人家同不同意；如今轮到自己被“蒸馏”，倒先喊起冤来了。用他的话说，“知识本来就是免费的，很难锁住”。

这些大厂的姿势惊人地一致：假装自己支持开源，实际只想着让别人开源，还要回头骂那个开门的人偷东西。而DeepSeek，把方法论这种最核心的东西大大方方端了出来。它非但不怕你“蒸馏”，根本就是把家底摊在桌上，等着全世界随便拿。

2024年底的V3模型，它把训练好的模型直接送出来，业内叫“开放权重”，相当于把一道难题的最终答案免费发给所有人。

2025年初的R1，它连“怎么用强化学习让模型自己练出推理/思维链能力”的技术报告、外加6个"缩小版"蒸馏模型一起给了出来。

这一次更进一步，把“怎么让模型答得更快”的训练方法也教了。权重、全套、方法论，一层比一层往里掏。

当然，公平讲，DeepSeek也没到家门全开、任君挑选。严格按OSI的标准，它训练用的原始数据其实也没全公开。但“开放了九成”和“只露一条门缝”的区别，明眼人都看得出来，也明白区别有多大。

慷慨不是天真，背后是一盘更大的棋

白送方法论、把价格砸到地板，看着像散财童子。可你要真当他是冤大头，就小看梁文锋了。

2025年2月，DeepSeek在《DeepSeek-V3/R1推理系统概览》里做了一组理论测算：它的服务器，如果把每一次调用都按“最贵那档”价格收费，理论上的利润率能到545%。

注意这是“理论上”，现实是大多数调用都没办法按照“最贵那档”收费。很多人用的网页版和App根本是免费的，更便宜的模型才是主力、半夜还自动打折，所以DeepSeek的“实际收入远比这低”。但这个利润率已经说明了，DeepSeek的定价有非常大的操作空间。它的便宜不是赔本赚吆喝，是利润率可以压得足够低。

这就和大厂的低价，分出了两条道。

字节的豆包、阿里的通义也把价格打得极低，但那是一笔生意：模型接口是个“鱼饵”，亏点没关系，先把客户钓进自家的云服务里，再靠卖云计算资源回本，业内叫“以模型带云”。

DeepSeek没有云生意要喂，它把价格打低，纯粹因为成本压得住；它把模型开源，是真把模型当成了像水电一样人人可用的公共品。同样是便宜，一个是钓客户的鱼饵，一个是效率加理想的副产品。

这个策略就对OpenAI这类公司很致命了。科技分析师本·汤普森（Ben Thompson）有个比方：模型正在变成“大白菜”，大家很快分不出高下，到那时唯一能拼的，就是谁的成本更低——而这恰好是DeepSeek的强项。

更致命的是，DeepSeek把模型一开源，别人就能靠“蒸馏”低成本复制出接近的能力。OpenAI、Anthropic砸几十亿美元辛苦训出来的领先，可以更轻松地就这么被一点点抹平。（对比一下：DeepSeek是大大方方让你蒸，它们是关着门防你蒸。）

同时，DeepSeek根本不在乎自家这点生意。专门研究芯片和AI的机构SemiAnalysis发现：用DeepSeek官方渠道的人其实每月都在减少，但全世界其它平台“转售”它模型的用量，反而暴涨了近20倍。

梁文锋早说过：“我们只负责基础模型和前沿创新，其它公司在DeepSeek的基础上做应用就行，没必要自己做。”它要的不是接口那点钱，是让整个行业都长在它的地基上。

这盘棋的威力，2025年1月就让全世界见识了一次。当时DeepSeek的R1模型一发布，证明了“不靠堆天价显卡也能做出顶尖AI”。卖AI芯片的英伟达股价应声暴跌，一天就蒸发5890亿美元，那是美股有史以来最大的单日蒸发。

投资人信了好几年的“搞AI就得无限烧钱买卡”，被结结实实打了一记闷棍。

他用200亿，把开源这条路定死了

今年4月，DeepSeek被曝开启了一轮私募融资。

先说清楚，这不是“上市”。DeepSeek到今天都还没上市、股票没公开卖给大众，这是它成立以来头一回向外面拿钱。

本轮融资规模约510亿元人民币，谈下来公司估值到了约4000亿。腾讯、宁德时代、网易、京东这些大公司都掏了钱进来。

最重要的，是梁文锋自己一个人出了约200亿，是这轮出钱最多的，差不多是腾讯的两倍；而且用的是他个人的钱，不是他名下的幻方公司的。

融资的方式也很特别。腾讯这些外部投资人，钱不能直接打进DeepSeek，得先汇进一个由梁文锋亲自管理的资金池，钱进去之后，这些投资人既没有投票权，还得把钱锁在里头5年不许撤，大概相当于存了一笔5年的定期。唯一的例外，是“国家队”的AI产业基金。

与此同时，梁文锋还把自己的直接持股从约 1%一口气提到34%，牢牢攥着接近100%的表决权。

钱，欢迎你进来；但这家公司往哪走、要不要继续开源、要不要急着赚钱，其他人没有发言权。

事实上，梁文锋是铁了心要走开源这条路。

他在投资人见面会上，把丑话讲在前头：“把突破性研究放在赚钱之前”，“继续做开源，奔向AGI”——也就是通用人工智能那个终极目标。

开源这条路，本来就不靠卖模型挣钱，它最怕哪天，一群只盯着回报的股东骑到头上，逼他关掉开源、转头收割用户。于是他用自己的200亿、加上那套“投资人没有投票权”的设计，提前把这个风险规避掉。

这实际上已经是梁文锋为理想做出的让步了。DeepSeek过去最大的标签，恰恰是“不融资、不商业化、不路演”。

如今估值4000亿，可它眼下的真实收入，几乎为零。澎湃新闻评论说：梁文锋其实是在赌接下来这一年，DeepSeek能不能从一个“最强开源模型”，变成一家“真能赚到钱的公司”。

控制权是守住了，就算商业化这道题答不出来，方向盘已经焊死，他自己也得硬着头皮往下走。

草根出身，怎么成了圣人

最后有一个有趣的问题，梁文锋自己是怎么能掏出来200亿的？

答案在他的发家史里。

梁文锋没有什么背景，他1985年生在广东湛江一个小村子，父母都是乡村小学教师。他是一个浙大出来的工科学霸，本科电子信息工程，硕士读的是教机器“看图认东西”的机器视觉。

真正让他发家的，是炒股。2008年金融危机那会儿，他揣着8万块本金，写程序破解炒股软件的接口、让电脑自动找规律下单，一头扎进当时国内还很蛮荒的“量化交易”。

这个量化交易简单来说，就是不靠人盯盘拍脑袋，而是让电脑在海量行情数据里毫秒级地找规律、自动下单，比人快、也比人稳。

七年下来，他靠每年超过100%的复合收益，把自己滚成了亿元富豪；2015年创立幻方量化，规模从十几亿一路滚到2021年巅峰的约一千亿，跻身中国量化界的“四大天王”。

更妙的是，做量化本来就要拼算力——电脑算得越快，越能抢在别人前头下手。所以幻方很早就自己搭超算、疯狂囤显卡：2020年的“萤火一号”、2021年的“萤火二号”，一口气囤了上万张英伟达最顶级的AI显卡A100，幻方是当时全亚洲最早攒下这么多卡的公司之一。这些型号的显卡后来都被美国卡着，不让卖给中国的。

这堆算力，原本是给炒股用的。可到了2023年，风向变了。前一年底ChatGPT横空出世，全世界突然都在抢显卡做AI——而梁文锋手里，恰好攥着一堆别人抢都抢不到的卡。

2023年4月他宣布进军通用人工智能，7月成立深度求索（DeepSeek），把这批算力、幻方赚的钱、连同一整队搞机器学习的工程师，一股脑掉头对准了大模型，这才有了后来震动硅谷的DeepSeek。