AI圈懵了:一家巴西市政IT公司开源的大模型,杀进了全球第一梯队

机器之心·2026年06月15日 08:26
一个市政府IT公司,做出了全球前沿大模型

6月14日,除了全球(非美)被禁的 Claude Fable 5,AI 社区还被一个开源模型刷屏了。

有推特博主发现,一个由巴西里约热内卢市政府旗下 IT 公司开源的模型Rio 3.5 397B,在多项基准测试中超越了 Qwen 3.7 Plus 等开源模型,而这个模型的基础模型还是 Qwen3.5-397B-A17B

另一位推特博主「Chubby」对此表示不可思议,「一个以前从来没听过的模型现在成了开源 SOTA,甚至超过了 Qwen 3.7。」

「这让所有人都挺意外。直到今天,巴西当地从业者几乎没人知道这个模型的存在。」

这已经是本周第二个基于 Qwen3.5 做后训练、并跻身前沿水平的模型了。另一个是 Nex-N2-Pro 397B,同样基于 Qwen3.5-397B-A17B 构建,性能可比肩 GPT-5.5 和 Opus 4.7 等顶级模型。

Rio 3.5 的崛起让 Huggingface 联合创始人兼 CEO Clem Delangue 发出了感叹,「AI 的未来没有什么是注定的。接下来会发生,我们每个人都有选择和行动的空间:路径一:闭源 API,权力集中,未来由硅谷和华盛顿少数人决定。路径二:开源 AI,让每个人都能参与、拥有并共同构建,包括里约市这样的机构。选你的路吧,朋友。」

接下来,我们来了解一下 Rio 3.5 397B 模型的技术细节。

Huggingface 地址:https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B#rio-35-open-397b

Rio 3.5 Open 397B 是一款前沿级通用 AI 模型,由里约热内卢市政府旗下的市政 IT 公司 IplanRIO 开发。

该模型基于 Qwen 3.5 397B 进行后训练,在智能体编程、数学、STEM、多语言和多模态等基准测试中达到了开源模型的领先水平,相比基座模型有显著提升,并且能够与全球最强的开源和闭源模型竞争。

模型核心特性包括如下:

  • 397B 总参数,17B 激活参数,采用混合专家架构(MoE);
  • 1,010,000 token,也就是 100 万级上下文窗口;
  • 集成 SwiReasoning:可在显式推理和潜空间推理之间动态切换,在准确率和效率上实现更优平衡;
  • 通用能力强:在智能体编程、推理、指令遵循和多模态任务上表现突出;
  • 多语言能力强:在葡萄牙语、英语、中文以及数十种其他语言中都有较好表现;
  • 采用 MIT 许可证:完全开放,可用于商业和研究用途。

其中,SwiReasoning 是一种免训练推理框架,基于 Shi 等人 2025 年的研究,可根据基于熵的置信度信号,在显式思维链推理和潜空间推理之间动态切换。这样既能提升准确率,也能大幅提高 token 效率。该模型在训练时,也明确针对潜空间推理带来的效率增益进行了优化。

论文地址:https://arxiv.org/abs/2510.05069

智能体编程与软件工程基准测试:

知识与推理基准测试:

数学基准测试:

多语言基准测试:

智能体与指令遵循基准测试:

参考链接

https://x.com/kimmonismus/status/2065911865390063791

https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B

https://x.com/ZenMagnets/status/2065796012820848699

https://x.com/SemiAnalysis_/status/2065894494935933191

本文来自微信公众号“机器之心”(ID:almosthuman2014),作者:关注开源的,36氪经授权发布。

+1
7

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

在一个人人都可以制造真实的年代,听众还愿意相信多久?

3小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业