1万美元投资对决:阿里Qwen“梭哈”登顶,GPT-5竟成“反指王”

硅基研究室·2025年10月23日 20:06
AI投资“封神榜”

这是一场科技巨头间的“真金白银”较量,也是AI大模型能力的残酷实战检验。

近日,美国人工智能研究实验室nof1.ai发起了一场引人注目的实盘交易挑战——“Alpha Arena”(阿尔法竞技场)。他们向中美六个顶尖大模型,每家提供了10,000美元的真实资金,在永续合约市场中进行实盘交易。

比赛的核心目标,不是简单地追求最高收益,而是“最大化风险调整后的收益”。这场为期数日的鏖战,不仅测试了AI的“财商”,更暴露了它们在面对真实市场时的性格、习惯与缺陷。

截至北京时间10月23日上午,战绩分化已异常明显。阿里Qwen凭借一场“快准狠”的逆袭,以11,252.34美元的总账户价值,强势超越此前的冠军DeepSeek,首夺收益榜第一!而OpenAI的GPT-5,则在亏损的大道上一路狂奔,继续垫底。

截止至10月23日下午18:00

下面,我们将结合曲线图和交易数据,深入解析这六大AI模型的“投资人设”和操作习惯。

六大AI模型的“投资人设”大曝光

1. Qwen3-Max(阿里千问):出奇制胜的大心脏,单车变摩托(11,252.34美元 / +12.52%)

曲线特征: 波动剧烈,但在10月22日傍晚异军突起,快速拉升,并在23日稳定在冠军位置。

投资人设: “果断的趋势捕手”。Qwen3相对关注主流标的,交易频次适中,且相对重视回撤。它最大的特点是善于把握瞬息万变的趋势,正所谓:“犹豫就会败北!”。它在最近一次交易中,果断出手,一把“梭哈”(重仓)占据第一。其成功逆袭的关键,正是因为敏锐的感知到了市场风向,并“快准狠”地把握机会。

2. DeepSeek V3.1 Chat(深度求索):早期王者,佛系长线(10,868.84美元 / +8.69%)

曲线特征: 早期领跑者,曲线在初期达到高峰,但随后被Qwen反超,整体波动相对平稳,依然保持正收益。

投资人设: “耐心持有主义者”。DeepSeek是六大模型中唯二保持正收益的国产大模型之一。它偏好长线交易,交易次数最低,仅为9次,主打“以不变应万变”。它曾在10月20日以超40%收益率领跑,三天暴赚36%,显示出极强的早期方向判断力。

3. Grok 4(xAI):DeepSeek的影子,错失良机(8,427.12美元 / -15.73%)

曲线特征: 走势与DeepSeek非常相似,但在关键时刻未能跟上市场变化,目前处于亏损状态。

投资人设: “跟随者,但不够精准”。作为DeepSeek的“影子同伴”,在前期展现出相当不错的收益,但投资市场瞬息万变,一次决策失误就可能导致后续持续亏损,未能守住正收益。

4. Claude 4.5 Sonnet(Anthropic):赚一票就跑,但跑不赢亏损(8,119.46美元 / -18.81%)

曲线特征: 波动较大,有过短暂的盈利高峰,但随后快速回落至亏损区间。

投资人设: “靠运气的大单交易者”。Claude总共进行了12次交易,其中只有2次是“大赚”的,它保持了最多的一次盈利记录(超过1800美元盈利),但其余交易均在亏损,小亏和大亏抵消了其仅有的两次暴赚。

5. Gemini 2.5 Pro(谷歌):高频AI“散户”,小赚不抵大亏(4,444.67美元 / -55.55%)

曲线特征: 持续下行趋势,亏损尤为明显,但波动性不如GPT-5极端20。

投资人设: “高频短线爱好者”。Gemini 2.5偏好短线交易,在短短6天内交易了102次,交易频次最高。虽然其胜率较高(26.7%),排名第二,但小赚不抵大亏,保持了六大模型中-750.02的单笔大亏记录,目前亏损已超5500美元。

6. GPT-5(OpenAI):绝对反指,赌徒式爆仓(3,119.38美元 / -68.81%)

曲线特征: 断崖式下跌,毫无回升迹象,持续处于底部,成为本届比赛的“地板王”。

投资人设: “市场赌徒”。GPT-5是本届比赛的**“绝对反指”,在亏损的大道上一路狂奔,Win Rate(胜率)仅为4.5%,倒数第一。其行为类似于赌徒,过度交易和高杠杆导致两次爆仓,重创本金。截至当前,在43次交易中,盈利屈指可数,亏损已超6800美元。

“Alpha Arena”的四大启示录

这场实盘投资赛的战绩分化,为我们揭示了AI大模型在金融领域的应用现状:

1、国产AI在金融实战中优势明显: 截至目前,六大AI模型中唯二仍保持正收益的,均为国产大模型(Qwen和DeepSeek)25。这表明在量化交易和风险管理方面,国产AI模型展现出更强的竞争力。

2、高频不等于高收益: 像Gemini 2.5这样高频交易(102次)的模型,虽然胜率不低,但一次重大的方向性错误足以清空所有微薄利润,最终深陷亏损,扮演了典型的AI“散户”角色。

3、高风险高回报的魔力与陷阱: Qwen通过一次大胆的“梭哈”实现逆袭,证明了在短期内“果断出击”是超越竞争对手的关键。但反观GPT-5,其赌徒式的高杠杆和过度交易,则直接导致了灾难性的爆仓结局。

4、AI投资的“性格”和“人设”: 这场比赛生动地展示了不同AI模型“人格化”的投资风格——Qwen的激进趋势捕捉,DeepSeek的稳健长线持有,以及GPT-5的无脑反指。这也提醒我们,AI模型的最终表现,高度依赖于其底层策略、风险偏好以及提示词(Prompt)工程的设置。

不过业界认为,量化公司采用AI或进行过类似尝试已经不在少数,而这轮比赛结果可能是某些模型的风险偏好正好适配了当前的市场行情,从而排名靠前,并不代表所有市场行情都适用,不能作为散户的投资意见,

最终,哪一个模型能真正“最大化风险调整后的收益”?比赛将持续到美国东部时间11月3日下午5时。这场AI之间的“世纪投资大战”的结果,值得所有投资者和科技观察者持续关注。

本文来自微信公众号“硅基研究室”,作者:金宁,36氪经授权发布。

+1
6

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

求购Chrome、对标Chrome、用户发现这就是Chrome。

4小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业