硅谷青睐的中国模型更新了,一觉醒来,直接套壳
【导读】智谱作为「大模型第一股」赴港上市前夕,直接掏出了旗舰模型GLM-4.7并开源!
2025年底智谱压轴了,还是一炮双响!
一份招股书冲刺「大模型第一股」,紧跟着发布了最新一代开源大模型GLM-4.7!
经过一年的狂飙突进后,智谱用一场资本和科技完美共振的盛宴收官了。
GLM-4.7这次以「Coding」能力提升为核心定位,直接对标全球顶尖编程模型Claude Sonnet 4.5,在多个权威榜单上不仅拿下了开源第一,更实现了国产模型对硅谷顶尖闭源模型的贴身肉搏。
这一战绩在Vals Index上体现得淋漓尽致。
作为一个不仅考量代码能力,还加权了金融、法律等高价值复杂任务的权威榜单,Vals Index向来被视为大模型「经济价值」的风向标。
GLM-4.7在这里出道即巅峰,直接空降开源模型第一名!
这意味着,在一个不论出身、只论实力的竞技场里,它把一众知名的欧美开源模型甩在了身后,证明了开源模型在处理高难度、高价值任务上,已经具备了替代闭源巨头的实力。
而在更能反映开发者真实体感的Design Arena中,GLM-4.7的表现则更具戏剧性。
由开发者盲测投票得出的胜率(Win Rate)和Elo评分中,GLM-4.7高居第二,紧紧咬住了谷歌的Gemini 3 Pro Preview,甚至超过了Claude Opus 4.5和GPT-5.2。
与此同时,在代码竞技场WebDev中,GLM-4.7更是直接斩获开源第一,跻身全球第六。
高耸的柱状图不只是数字,它是全球开发者用脚投票的结果:在高强度的实战对比中,人们更愿意使用GLM-4.7。
这标志着国产模型终于跨越了从「能用」到「好用」、从「参数对齐」到「体验对齐」的那道天堑。
在2025年的大部分时间里,Anthropic的Claude系列,特别是Claude Opus 4.5,一直被全球开发者奉为「编程之神」。
但是GLM-4.7的发布,选择了正面硬刚Claude,对这波操作最开心的,莫过于大洋彼岸的硅谷程序员们了。
他们一觉醒来惊喜地发现:中国开源界又「送温暖」了! 这次不仅有现成的新模型可以「套壳」,性能还强得离谱。
这大概就是2025年AI圈魔幻的乐子:美国的编程工具,都等着中国发模型。
被老外套壳的中国大模型,又更新了~
GLM上次火出圈,还是因为Cursor、Windsurf的「自研模型」被发现其实是套的GLM的壳。
要知道,Cursor的市值加起来比两个智谱都高,结果基座模型还是用的咱们国产的。
这一次,GLM-4.7更新,大洋彼岸的美国明星科技企业直接不藏了!
备受海外用户欢迎的Cline、Kilo、Vercel等一众主流AI平台,纷纷在第一时间官宣接入,并对其取得的巨大进步高度评价。
估值40亿美元的Fireworks同样发电Day0支持——美国人民有更好的模型可以用了!
为何老外偏爱「中国开源模型」
硅谷的精明,在于「不看广告看疗效」。
他们选择GLM等开源模型,无非是因为它不仅便宜,而且真的好用。
毕竟,相比于昂贵的GPT和Claude系列,GLM提供了几乎同等的Coding能力,但成本极低。
对于需要大量消耗Token的Agent工具来说,GLM是极佳的「降本增效」引擎。
不止于美国,智谱目前已在海外拥有超过15万用户,因而每次发布新模型,都备受海外开发者关注。
而且老外对于GLM的热情不仅仅是开源免费,能打才是核心因素。
「体感」拉满,歪果网友又玩疯了
AI Coding因为涉及到「抽卡」(通过多次重复来得到满意的输出),所以很多展示出来Demo到底是对话几轮以后的结果,很难说清楚。
因而,开发者的使用「体感」很能说明问题。
GLM每次一发布,国外的论坛就集体高潮,有赞扬的,有质疑的,但都表现出极大的热情。
比如有人认为上一个版本GLM-4.6就已经接近Claude的4.5,而且要比4.0更好。
甚至还有外国老哥认为GLM-5会直接问鼎SOTA!
国外的著名KOL们也开始自来水的推荐。
甚至有老哥看了GLM的价格,直接决定先买1年的服务!
让我们来看看,一向脑洞大开的国外网友能用GLM-4.7玩出什么花吧。
做个小游戏,不在话下。
Agentic能力的核心「工具调用」,完成得非常出色。
做个看起来酷炫的网页,也是信手拈来。
「理综」考试(多任务集合),顺利通过!
官方搓出来的「植物大战僵尸」更是惊艳。
小测一下
正如前文所说,目前主流的编程工具,如Claude Code、Cursor、Cline等等,都能完美支持GLM-4.7的部署。
以最火热的Claude Code为例,智谱在官方文档中给出了特别详细的逐步教程(https://docs.bigmodel.cn/cn/coding-plan/tool/claude)。
进入命令行界面,执行如下运行Coding Tool Helper:
- npx @z_ai/coding-helper
一键式配齐API等环境参数后,重启Terminal,输入claude,即可在Claude Code中使用GLM-4.7开启你愉快的vibe coding了!
直接给出提示词:
设计一个细节丰富的体素风格(voxel-art)场景,核心要是在一座生机勃勃的花园里放一座华丽的宝塔。植物种类要多——特别是樱花树,一定要多来点——确保整体画面看起来生动活泼、色彩鲜艳,而且视觉冲击力要强。随便你用什么体素或者WebGL库都行,但最后给我的必须是一个独立的HTML文件,让我能直接粘贴代码然后在Chrome浏览器里打开看。
很快,Gemini 3 Pro就交卷了。
除了宝塔有点歪之外,效果还不错。
GLM-4.7给出的效果,有点子惊喜。
除了宝塔、小溪、草地,以及一大片樱花树之外,还有满天飞舞的花瓣。
更有意思的是,它还自己设计了一键自动旋转画面的功能,沉浸感直接拉满。
而且,网页版还能实时渲染代码,非常方便。
第二段提示词:
1帮我做一个技能五子棋的游戏网页,要求是在普通的五子棋规则上,玩家可以使用技能,其中包括飞沙走石,静如止水,力拔山兮。「飞沙走石」,是把对手的棋子直接扔进什(石)刹海,2技能点;「静如止水」是凝结时间,把对方「速冻」,4技能点;「力拔山兮」是摔坏棋盘,8技能点,直接获胜。黑棋和白棋的技能点要分开算,并且每走一步都可以累加。直接给我HTML文件,画面要美观。需要设计一个电脑对手,让我可以直接和它对战。
GLM-4.7设计的这个「AI」简直绝了,主打一个「五五开」。
首场惨败之后瞬间上头,反手就是三连局,根本停不下来……
再来一个更厉害的!
首先,输入如下提示词:
请用HTML、CSS和JS做一个浏览器操作系统,要求包含下面这些功能:
- 至少有5个App;
- 这5个App里,必须有两个是真的能玩的游戏;
- 支持更换壁纸;
- 再加一个你自己定的「特殊」功能,你得说明白这个功能是啥,以及它特别在哪里。
想当初,让AI写个能玩的贪吃蛇都费劲。
现在,只需要一小段Prompt,不仅能一口气生成5个能玩的应用,甚至还能搞出一个「操作系统」。
归根结底,AGI是一场长跑,跑分只是评估性能的一种方式。
虽然指标提供了必要的参考,但最重要的始终是「体感」。
真正的智能,不仅仅在于考试拿满分或数据处理得更快,还在于它能否无缝地融入我们的工作流与生活。
而这一次,它融入的是「编程」。
参考资料: GLM-4.7上线并开源:更强的编码
本文来自微信公众号“新智元”,编辑:编辑部,36氪经授权发布。















