梁文锋,真是人间清醒
这个周末,DeepSeek又闷声放了个大的。
他们把给V4提速的技术DSpark连同训练/评测工具箱DeepSpec(含论文和三种算法)一起开源丢上了GitHub,又把"挂了提速模块的V4权重"(V4-Pro-DSpark、V4-Flash-DSpark)丢上了AI模型开源社区Hugging Face。全部MIT许可(一种最宽松的开源许可证)、免费可商用。
一时间,整个互联网又炸了。小红书上,有人发帖称“梁圣的恩情,还不完了”;有人喊他活菩萨,有人说他一个人扛起了整个开源圈的脸面。
海外一位常年盯着中国大模型的博主Teortaxes甚至直呼,DeepSeek开源DeepSpec是“出于浩瀚的慷慨”。(Out of their vast goodwill, they also open source DeepSpec: "a codebase for training and evaluating draft models for speculative decoding)
到底梁文锋有多伟大,才称得上这一个“圣”字?
告诉世界,什么叫真正的开源
和全球的大厂对比一下你就知道DeepSeek有多慷慨。
先说OpenAI,名字里就带着“Open”,可它早名不副实了。原本OpenAI是一个公益向的项目,当时联合创始人山姆·奥特曼(Sam Altman)觉得:既然AI的到来不可避免,那我就先去创造出来,然后自己去定义这个行业。结果随着马斯克退出、微软注资商业化转型,OpenAI已经Open不起来了。
2023年它发布当家模型GPT-4时,配套的技术报告里干脆写明:出于竞争考虑,不透露任何技术细节。连模型多大、怎么搭的都不告诉你。
到了2025年,DeepSeek用开源且便宜得多的模型把整个行业震了一下(后面会讲),OpenAI眼看免费的中国开源模型就要成为全世界程序员的默认选择,慌了,才在2025年8月赶忙放出一个叫gpt-oss的开源模型救场。
奥特曼后来都认了:“我们之前站在了历史错误的一边。”可即便这个gpt-oss,也只给了模型本身,训练用的代码和数据照样藏着掖着。
Meta的Llama模型看着最开放,许可证里却全是小字陷阱:你的产品月活用户超过7亿,就得另外找Meta掏钱买授权,给不给“全看它心情”。
专门给开源立规矩的机构、开源促进会OSI(Open Source Initiative),两次公开点名“Llama根本不算开源”,还叫他们是open washing,意思是“假装开源、洗个好名声”。
至于Anthropic,到今天一个开放模型都没放出来过,是AI圈最封闭的一个,他们的理由全是“为了安全”。CEO达里奥·阿莫代伊(Dario Amodei)明牌反华,公开主张美国要卡死对华的AI芯片出口,害怕自己“被中国追上”。
更恶劣的是,这帮把门焊死的,反过来一个个指控DeepSeek“偷”(准确说是“蒸馏”)了自己的模型。
蒸馏,就是拿别人模型的回答来训练自己的小模型,相当于偷师解题过程。2025年初DeepSeek刚火,OpenAI就放话说DeepSeek“有迹象”不当蒸馏了自家模型;白宫方面的负责人大卫·萨克斯(David Sacks)更在电视上说“有实质证据”,最后反正没拿出来。
一年后,Anthropic也下场了,指控DeepSeek等三家中国公司用2.4万个假账号、跟Claude聊了1600多万次,“工业级”地套它的本事。
DeepSeek既没承认、也没否认。
但模型作为一种知识的归纳提炼,很难说是谁的。康奈尔大学讲师卢茨·芬格(Lutz Finger)说:大厂当年拿《纽约时报》、福布斯的文章去喂自己的模型时,可没问过人家同不同意;如今轮到自己被“蒸馏”,倒先喊起冤来了。用他的话说,“知识本来就是免费的,很难锁住”。
这些大厂的姿势惊人地一致:假装自己支持开源,实际只想着让别人开源,还要回头骂那个开门的人偷东西。而DeepSeek,把方法论这种最核心的东西大大方方端了出来。它非但不怕你“蒸馏”,根本就是把家底摊在桌上,等着全世界随便拿。
2024年底的V3模型,它把训练好的模型直接送出来,业内叫“开放权重”,相当于把一道难题的最终答案免费发给所有人。
2025年初的R1,它连“怎么用强化学习让模型自己练出推理/思维链能力”的技术报告、外加6个"缩小版"蒸馏模型一起给了出来。
这一次更进一步,把“怎么让模型答得更快”的训练方法也教了。权重、全套、方法论,一层比一层往里掏。
当然,公平讲,DeepSeek也没到家门全开、任君挑选。严格按OSI的标准,它训练用的原始数据其实也没全公开。但“开放了九成”和“只露一条门缝”的区别,明眼人都看得出来,也明白区别有多大。
慷慨不是天真,背后是一盘更大的棋
白送方法论、把价格砸到地板,看着像散财童子。可你要真当他是冤大头,就小看梁文锋了。
2025年2月,DeepSeek在《DeepSeek-V3/R1推理系统概览》里做了一组理论测算:它的服务器,如果把每一次调用都按“最贵那档”价格收费,理论上的利润率能到545%。
注意这是“理论上”,现实是大多数调用都没办法按照“最贵那档”收费。很多人用的网页版和App根本是免费的,更便宜的模型才是主力、半夜还自动打折,所以DeepSeek的“实际收入远比这低”。但这个利润率已经说明了,DeepSeek的定价有非常大的操作空间。它的便宜不是赔本赚吆喝,是利润率可以压得足够低。
这就和大厂的低价,分出了两条道。
字节的豆包、阿里的通义也把价格打得极低,但那是一笔生意:模型接口是个“鱼饵”,亏点没关系,先把客户钓进自家的云服务里,再靠卖云计算资源回本,业内叫“以模型带云”。
DeepSeek没有云生意要喂,它把价格打低,纯粹因为成本压得住;它把模型开源,是真把模型当成了像水电一样人人可用的公共品。同样是便宜,一个是钓客户的鱼饵,一个是效率加理想的副产品。
这个策略就对OpenAI这类公司很致命了。科技分析师本·汤普森(Ben Thompson)有个比方:模型正在变成“大白菜”,大家很快分不出高下,到那时唯一能拼的,就是谁的成本更低——而这恰好是DeepSeek的强项。
更致命的是,DeepSeek把模型一开源,别人就能靠“蒸馏”低成本复制出接近的能力。OpenAI、Anthropic砸几十亿美元辛苦训出来的领先,可以更轻松地就这么被一点点抹平。(对比一下:DeepSeek是大大方方让你蒸,它们是关着门防你蒸。)
同时,DeepSeek根本不在乎自家这点生意。专门研究芯片和AI的机构SemiAnalysis发现:用DeepSeek官方渠道的人其实每月都在减少,但全世界其它平台“转售”它模型的用量,反而暴涨了近20倍。
梁文锋早说过:“我们只负责基础模型和前沿创新,其它公司在DeepSeek的基础上做应用就行,没必要自己做。”它要的不是接口那点钱,是让整个行业都长在它的地基上。
这盘棋的威力,2025年1月就让全世界见识了一次。当时DeepSeek的R1模型一发布,证明了“不靠堆天价显卡也能做出顶尖AI”。卖AI芯片的英伟达股价应声暴跌,一天就蒸发5890亿美元,那是美股有史以来最大的单日蒸发。
投资人信了好几年的“搞AI就得无限烧钱买卡”,被结结实实打了一记闷棍。
他用200亿,把开源这条路定死了
今年4月,DeepSeek被曝开启了一轮私募融资。
先说清楚,这不是“上市”。DeepSeek到今天都还没上市、股票没公开卖给大众,这是它成立以来头一回向外面拿钱。
本轮融资规模约510亿元人民币,谈下来公司估值到了约4000亿。腾讯、宁德时代、网易、京东这些大公司都掏了钱进来。
最重要的,是梁文锋自己一个人出了约200亿,是这轮出钱最多的,差不多是腾讯的两倍;而且用的是他个人的钱,不是他名下的幻方公司的。
融资的方式也很特别。腾讯这些外部投资人,钱不能直接打进DeepSeek,得先汇进一个由梁文锋亲自管理的资金池,钱进去之后,这些投资人既没有投票权,还得把钱锁在里头5年不许撤,大概相当于存了一笔5年的定期。唯一的例外,是“国家队”的AI产业基金。
与此同时,梁文锋还把自己的直接持股从约 1%一口气提到34%,牢牢攥着接近100%的表决权。
钱,欢迎你进来;但这家公司往哪走、要不要继续开源、要不要急着赚钱,其他人没有发言权。
事实上,梁文锋是铁了心要走开源这条路。
他在投资人见面会上,把丑话讲在前头:“把突破性研究放在赚钱之前”,“继续做开源,奔向AGI”——也就是通用人工智能那个终极目标。
开源这条路,本来就不靠卖模型挣钱,它最怕哪天,一群只盯着回报的股东骑到头上,逼他关掉开源、转头收割用户。于是他用自己的200亿、加上那套“投资人没有投票权”的设计,提前把这个风险规避掉。
这实际上已经是梁文锋为理想做出的让步了。DeepSeek过去最大的标签,恰恰是“不融资、不商业化、不路演”。
如今估值4000亿,可它眼下的真实收入,几乎为零。澎湃新闻评论说:梁文锋其实是在赌接下来这一年,DeepSeek能不能从一个“最强开源模型”,变成一家“真能赚到钱的公司”。
控制权是守住了,就算商业化这道题答不出来,方向盘已经焊死,他自己也得硬着头皮往下走。
草根出身,怎么成了圣人
最后有一个有趣的问题,梁文锋自己是怎么能掏出来200亿的?
答案在他的发家史里。
梁文锋没有什么背景,他1985年生在广东湛江一个小村子,父母都是乡村小学教师。他是一个浙大出来的工科学霸,本科电子信息工程,硕士读的是教机器“看图认东西”的机器视觉。
真正让他发家的,是炒股。2008年金融危机那会儿,他揣着8万块本金,写程序破解炒股软件的接口、让电脑自动找规律下单,一头扎进当时国内还很蛮荒的“量化交易”。
这个量化交易简单来说,就是不靠人盯盘拍脑袋,而是让电脑在海量行情数据里毫秒级地找规律、自动下单,比人快、也比人稳。
七年下来,他靠每年超过100%的复合收益,把自己滚成了亿元富豪;2015年创立幻方量化,规模从十几亿一路滚到2021年巅峰的约一千亿,跻身中国量化界的“四大天王”。
更妙的是,做量化本来就要拼算力——电脑算得越快,越能抢在别人前头下手。所以幻方很早就自己搭超算、疯狂囤显卡:2020年的“萤火一号”、2021年的“萤火二号”,一口气囤了上万张英伟达最顶级的AI显卡A100,幻方是当时全亚洲最早攒下这么多卡的公司之一。这些型号的显卡后来都被美国卡着,不让卖给中国的。
这堆算力,原本是给炒股用的。可到了2023年,风向变了。前一年底ChatGPT横空出世,全世界突然都在抢显卡做AI——而梁文锋手里,恰好攥着一堆别人抢都抢不到的卡。
2023年4月他宣布进军通用人工智能,7月成立深度求索(DeepSeek),把这批算力、幻方赚的钱、连同一整队搞机器学习的工程师,一股脑掉头对准了大模型,这才有了后来震动硅谷的DeepSeek。
说穿了,炒股和做AI看着风马牛不相及,底层却是同一套本事:海量数据、机器学习,再加自己堆起来的算力。
就是这么一个人,做了最不像生意的生意:免费开源、把价格打到地板、自己掏200亿。
梁文锋对待AI开源这件事,早把话撂在了前头:“在颠覆性的技术面前,闭源形成的护城河是短暂的。”“开源更像一个文化行为,而非商业行为,给予其实是一种额外的荣誉。”
免费送出方法论、把价格打到全行业都难受、自己掏200亿把开源的路守住。他想得很通透,他赌的不是哪个模型一时的输赢,是“开放”这条路本身,到底能不能走通。
所以别再纠结他是不是圣人了。一个清醒的理想主义者,本来就可以一边把家底掏给所有人,一边算盘打得比谁都精。
君子论迹不论心,圣人也一样。开源这条路,至少还没朝我们要钱。
本文来自微信公众号“硬核看板”(ID:yinghekb),作者:李沣,36氪经授权发布。















