1人1假期,肝完10年编程量,马斯克锐评:奇点来了

量子位·2026年01月05日 16:49
“以后一切都会不一样了”

以防你不知道编程Agent现在有多强,硅谷大佬们新年收假回来,纷纷写起了小作文。

最新一波分享里,Midjourney创始人David在𝕏上的激情发言是大热门:

这个圣诞节假期,我自己搞的编程项目,比过去10年我搞的都要多!It’s crazy!

他知道,以后一切都会不一样了。

住在互联网上的马斯克很快评论了这条推文,表达自己相同的看法:

We have entered the Singularity。我们已经进入奇点。

编程Agent杀疯了!好多人都这么说

在David这条推文引起了大家的共鸣,评论区里很多人都表达了自己有相同的经历。

搞得David开始觉得自己是不是有点大惊小怪——因为用AI Coding猛猛提效这件事,在他身边实在是太普遍了。

随手抓一个例子来说吧!

Anthropic现役工程师,Google DeepMind前杰出工程师Rohan Anil就分享称,“如果我有编程Agent,尤其是Claude的Opus,我能把我前6年的工作压缩到几个月内(完成)”。

咱们来看下,Anil“前6年”都在干什么。

2025年1月,他离开谷歌加入了Anthropic。

在谷歌期间,他领导了Gemini模型的工作,对Gemini预训练做出了巨大贡献。

再往前,Anil在谷歌大脑从事基础研究,包括训练算法、基础设施啥的。

比如谷歌首个Transformer推理,以及为核心服务提供的首批大规模TPU训练和推理交付模型,包括搜索中早期的大规模神经网络模型如RankBrain和DeepRank。

再往前的事咱就不回顾了。

但如Anil所说,有了编程Agent(Opus最佳),他几个月就能干6年的活。

谷歌首席工程师Jaana Dogan也有同样的经历和感慨。

自去年以来,我和团队一直在谷歌致力于构建分布式agent协调器。我向Claude Code描述了这个问题,它在一天内生成了我们去年构建的东西。

而且Dogan一而再再而三强调,这不是开玩笑,这就是事实。

虽然编程Agent还不能尽善尽美,但他觉得大家都值得一试,说不定就开辟一片新的天地。

同时,Dogan还很坦荡地表示,在编程方面,Gemini还是略逊一筹的

讲到这里中插一点评论区的拉踩小插曲(对不起我忍不住不笑.jpg)——

评论区有人对谷歌允许自家工程师使用竞品感到讶异。

也有人透露了小八卦:听说Meta强迫自家程序员得用llama 4。

那……心动不如行动?

扫了几眼,发现大家编程功力大涨,背后的功臣八成是Claude Code或者Opus。

这点倒是和评测集的反馈呼应上了。

最新版LiveBench(圣诞&新年假期期间,官方更新了LiveBench基准测试以防作弊)上,Claude 4.5 Opus登上了榜首

整体来说,Claude在AI编程、编程Agent方面一如既往,担任着扛把子角色。

Greg Brockman也发文感慨道:

感觉模型在软件工程实用性上,有了质的突破。

不过大家都在调侃说,Anthropic做到了OpenAI想做却没能做到的事情

实用性工具,还得是真刀真枪见本领呀……

因为讨论太过火热,Claude Code的开发者Boris Cherny说很多人都在问他Claude Code要怎么用。

每周能完成50-100个PR的他大大方方公开分享了自己的设置

而且非常简单!(Cherny说是因为Claude Code开箱即用的效果就已经很棒了,doge)

这里放一下Reddit网友摘取出来的重点~如果有需要可以在文末寻找直通车,去看看Cherny的原文。

关于创建验证循环:不要复杂化。只需给Claude提供一个查看代码的工具,并详细描述该工具,Claude会自行处理剩余部分。

关于管理多种功能:可并行运行多个Agent,但每个Agent都在自己独立的代码库分支中工作,以避免冲突。

关于“技能”与“快捷指令”:这俩可以交替使用,用户和模型都能调用它俩。

One More Thing

国产编程Agent产品似乎也嗅到了不一样的气氛,开始出招。

就在昨天,字节旗下的TRAE中国版SOLO已全量免费开放

更新到最新版,直接进入SOLO模式即可免费使用~

本文来自微信公众号“量子位”,作者:关注前沿科技,36氪经授权发布。

+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

被高估的“情绪价值”

2026-01-05

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业