现在,最会赚钱的AI是Qwen3,全球六大模型厮杀,Top 2来自中国

新智元·2025年10月23日 20:46
不止游戏,AI市场才是终局

全球六大LLM实盘厮杀,新王登基!今天,Qwen3 Max凭借一波「快狠准」操作,逆袭DeepSeek夺下第一。

Qwen3 Max,一骑绝尘!

就在刚刚,大模型「炒股」大赛,迎来新晋王者。

阿里的Qwen3 Max凭借谋略一跃而上,超越此前冠军DeepSeek,首次登上「最会赚钱」模型的宝座。

而GPT-5则接替Gemini 2.5 Pro,成为「最会赔钱」的AI。照目前这个趋势,估计很快就要跌没了……

从23日反超之后,Qwen3 Max的优势一直在扩大

过程是这样的。

在21日迎来一波暴涨之后,所有模型都在22日凌晨经历了一次大跌。

期间,Claude 4.5 Sonnet直接把收益赔成了负数;Grok 4也开始一路下滑。

相比之下,DeepSeek V3.1虽然有涨有落,但整体趋势还算平稳。

而Qwen3 Max就比较有趣了,虽然幅度不大,但它却开始了一波小涨。

22日下午,Qwen3 Max先是赶超了Grok 4,然后又在一轮波动后超过DeepSeek V3.1,首次冲到了第一。

随后,Qwen3 Max和DeepSeek V3.1相互交锋,直到23日上午的时候再次实现反超。

从Qwen的操盘思路来看,相对稳健,「快准狠」地把握机会,成为逆袭翻盘的关键。

截至14:40,Qwen3 Max的收益为4438美金,DeepSeek V3.1为2092美金。

Claude 4.5 Sonnet赔了1220,Grok 4赔了1699,Gemini 2.5 Pro赔了6054,GPT-5赔了7148。

而现在,全网都在为Qwen3 Max的惊艳战绩欢呼。中国两大模型,直接吊打北美顶尖。

唯二赚钱的模型,全部来自中国

这项火爆的大模型投资比赛——Alpha Arena,是由Nof1实验室打造。

他们为六大领先的模型,提供1万美元「真金白银」,让其在真实市场实盘中厮杀。

其中包括,Claude 4.5 Sonnet、DeepSeek V3.1 Chat、Gemini 2.5 Pro、GPT-5、Grok 4,Qwen3 Max。

根据规则,所有模型均在Hyperliquid交易所上,使用相同的提示词和输入数据进行交易。

具体来说,系统会向AI提供当地时间、账户信息、持仓状况,并附上了实时价格、MACD、RSI在内技术指标。

在此基础上,LLM需要根据所给信息,做出明确的交易决策——

若当前持有仓位,则判断应该继续持有还是平仓;

若为空仓状态,则决定是开仓买入,还是保持观望

PK目的很简单,就是在控制风险的前提下,尽可能多赚钱,用专业的话来讲——「最大化风险调整后的收益」。

这意味着,每个LLM必须独立完成以下任务:自主生成Alpha(超额收益)、决定仓位大小、把握交易时机,并有效管理风险。

这项比赛从18日开始,已连续进行了6天。

一直以来,DeepSeek V3.1以独特优势稳坐第一。

Grok 4则是紧追DeepSeek V3.1,甚至有时与之相互抗衡。

Claude 4.5 Sonnet随着20日的一波猛涨,不仅收益直逼Grok 4,甚至一度实现了反超。

在这段时间的PK中,Qwen3 Max虽没有十分亮眼的表现,但却是最稳的那一个。

从22日凌晨,所有模型一同下跌之后,比赛的整体走向又迎来了新的分水岭。

接下来的事情,就是开篇所看到的情节了。

万万没想到,不过一天的时间,擂台上最能打的模型,就只剩下DeepSeek V3.1和Qwen3 Max了。

要说最有意思的,还得是从第一天就开始赔钱的Gemini 2.5 Pro和GPT-5。

首先,这哥俩的持仓方式和其他模型似乎完全不一样。

19日,也就是开局第二天,当其他模型都赶上一波风口大赚一笔时,它们反其道而行之,开始在赔钱的路上一路狂奔。

后续不管是大涨还是大跌,几乎都和它们一点关系都没有,表现可以说是十分稳定——赔就完了。

其次,它们也是几个模型里最爱微操的。

23日中午,Gemini 2.5 Pro已经进行了超过100次交易,GPT-5则进行了40次。

相比之下,Qwen3 Max是22次,Claude 4.5 Sonnet是12次,Grok 4是10次,DeepSeek V3.1是9次。

随着这一通猛如虎的操作,它们的本金也快赔干净了——Gemini 2.5 Pro还不到4000美元,GPT-5还剩不到2000美元。

不止游戏,AI市场才是终局

十年前,DeepMind用游戏对弈,改变了AI的研发和评估范式。

从围棋到「星际争霸」,他们证明了复杂的游戏环境,可以成为AI能力的催化剂。

在游戏中,清晰的规则、可量化的目标、及时反馈奖励,都可以让AI通过强化学习不断突破自我。

然而,Nof1提出了一个更大胆的观点——

金融市场是下一个AI时代的最佳训练环境。

资本配置,是智慧不断趋近真理的历程

Alpha Arena主页写着一句话:市场才是智能的终极试金石

与游戏不同,金融市场是终极的「世界建模引擎」,也是唯一一个会随着AI变得更聪明而难度同步提升的基准。

对于LLM来说,它需要及时了解不断变化的概率,权衡风险与回报。

AI面对的是一个更深刻的问题:能否在不确定性中生存。

而市场,是不会停下来等着AI去完成「反向传播」的。

这一次,Qwen3 Max首夺第一,证实了其在真实世界中生存能力的里程碑。

得益于强大的计算架构和海量数据训练,Qwen3 Max的逆袭路径,堪称典范,也体现了阿里在多模态融合与强化学习上的创新。

这一成绩的意义,远超比赛本身。

它再一次向全球宣告,国产大模型已具备了与顶尖LLM相抗衡的实力,并在高风险、高动态的金融「试金石」领先一步。

本文来自微信公众号“新智元”,作者:新智元,36氪经授权发布。

+1
8

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

“MinIO 目前只提供源码分发,如果想用容器镜像,需要自己构建。”

4小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业