OpenAI Codex进入手机，国产“龙虾”们该醒醒了

世界模型工场·2026年05月15日 12:52

Agent之战已打响

今天，OpenAI推送了一个更新，却在科技圈引发了大量讨论。

Codex正式进入ChatGPT手机App。

现在，你可以在等地铁的时候，掏出手机看看AI昨晚帮你完成了哪些任务，或者批准一个它等待已久的决定。

然后，把手机揣回口袋，它继续工作，你该干嘛干嘛。

这不只是程序员的新玩具。

任何人都可以用它来完成工作，比如：写报告、整理数据、处理文件、自动化流程。AI真正做到了随时待命、持续工作。

但这个更新，对普通人意味着什么？

对已经喊了好几个月"养龙虾"的国内大厂来说，是不是一场真正的噩梦？

01 一场早已开打的Agent战争

要理解Codex为什么让人兴奋，得先搞清楚它在做一件什么事。

过去我们用AI，是一种问答关系。

你打开ChatGPT，输入问题，它回答，你复制粘贴，然后你自己去执行。

Codex不一样。

它是一个Agent，你交代任务，它去做，直到把事情做完。

更关键的是，手机端上线之后，它不需要你守在电脑旁边，AI可以在你睡觉、通勤、开会的时候持续工作。

但Codex不是第一个想到这件事的。

同样能做的，还有Anthropic的Claude Code，以及OpenClaw，也就是中文互联网上火遍全国的"龙虾"。

OpenClaw是最早跑出来的。

它开源、免费、可以接入任何大模型，它有持久记忆，越用越懂你；

它可以嵌进微信、飞书、钉钉，通过消息软件接收指令；

它甚至可以设定定时任务，在你没开口的时候主动去做事情。

从功能设计上看，它比Codex和Claude Code都要超前。

但OpenClaw有一个根本性的问题：它是极客玩具。

你得自己部署、配API、修bug，普通人看完教程就直接放弃了。

而且安全事故真实发生过，有人的邮件被批量删除，有人的信用卡被盗刷，有人多年积累的工作文件被一键清空。

它的一个核心维护者甚至在社区里警告："如果你不懂命令行，这个项目对你来说太危险了。这句话，基本上已经替它划定了用户边界。

Claude Code和Codex，就是在这个边界之外覆盖了更大的市场。

相较之下，Claude Code更早进入开发者视野。

今年2月，Anthropic就给Claude Code装上了远程控制。开发者扫个二维码，手机上就能接管电脑里的会话。

算下来，比OpenAI早了将近三个月，但热闹程度远比不上今天。

原因很简单，Claude Code太贵了，而且它在终端里敲命令的操作方式，天然就把普通人挡在了门外。

于是，Codex在这里打出了差异：更低的定价，更流畅的产品体验，加上今天上线的手机端，把AI干活这件事做成了真正触手可及的功能。

三者之间的关系，其实可以用一句话概括：

OpenClaw验证了需求，Claude Code教育了市场，Codex在收割。

Codex今天的动作，明确传递了一个信号，Agent的战场，正在从开发者圈子向所有人扩张。

价格越低、门槛越低、随时可用，这就是方向。

但真正应该感到压力的，不是Claude Code。

02 国内“龙虾”们，该醒醒了

过去几个月，国内科技圈掀起了一场"养龙虾"热潮。

阿里、腾讯、字节、百度......几乎所有叫得上名字的大厂，都推出了自己的OpenClaw集成产品。

地方政府跟着入场，补贴政策一个接一个，单项支持最高达500万元。

媒体铺天盖地，"AI数字员工""一人公司""生产力革命"，概念一个比一个响。

但热闹背后，有一个问题没人愿意正面回答：

这些产品，真的能干活吗？

说穿了，国内大厂做的"龙虾"产品，大多数走的是同一条路：

在OpenClaw的开源框架上套一层壳，接入自家的大模型，再打通飞书、微信、钉钉这些已有的流量入口。

这条路最快，成本最低，也最容易讲故事。

但OpenClaw只是个框架，真正决定Agent能不能干活的，是背后的模型。

Agent任务，对模型的推理能力、指令理解、容错处理要求极高。

Codex背后是OpenAI最新的模型，Claude Code背后是Anthropic的Claude。

国内大模型这两年进步显著，但在这类复杂任务的完成质量上，差距依然存在，短期内靠工程层面的包装很难补上。

结果就是，用户满怀期待地养了一只“龙虾”，交代了任务，等来的是一个做到一半的结果，或者一个需要反复纠错的流程。

新鲜感过去之后，留存率才是真相。

这些产品的商业逻辑，本来是靠Agent带动token消耗和云服务收入。

但如果Agent干不好活，用户根本不会持续用。

没有持续使用，token消耗无从谈起，云服务的想象空间也就此打住。

更麻烦的是，Codex今天的动作，把比较基准拉高了。

以前用户可能不知道Agent工具能做到什么程度，将就着用也就过去了。

但当Codex这样的产品触手可及、价格透明、体验流畅，用户的预期就变了。

一旦预期被拉高，那些能用但不好用的产品，用户会加速失去耐心。

03 国产“龙虾梦”，还能做多久？

那么，这场仗最终会怎么打？

有一个细节值得注意。

Codex手机端上线的同一天，OpenAI顺手披露了一个数字：

每周超过400万人在用Codex。

这表明Agent工具的普及速度，比大多数人预期的要快，窗口期正在收窄。

对国内厂商来说，最危险的不是今天。

今天Codex还没有完全打通中文语境，还没有深度接入国内办公生态，本地化运营也几乎空白。

但问题是，这些护城河能撑多久？

当身边的人开始用Codex真正把活干完，本土产品的比较劣势就会从数据变成口碑，从口碑变成用户流失。

更关键的是，这场竞争的本质不是产品之争，而是模型之争。

模型能力的积累，是时间和资源堆出来的，没有捷径。

所以摆在国内厂商面前，其实只有两条路。

一条是继续追赶通用Agent能力，正面竞争。

这条路最难，需要的是真正的模型投入，而不是生态套壳。但如果跑出来，回报最大。

另一条是放弃通用，深挖垂直。

医疗、法律、制造、政务，这些场景对数据安全、本地部署、行业知识有极高要求，是国外产品短期内很难渗透的地方，也是本土厂商的优势所在。

但无论走哪条路，有一件事已经无法回避：

靠"龙虾"概念圈用户的时代，结束了。

本文来自微信公众号“世界模型工场”，作者：世界模型工场，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

OpenAI Codex进入手机，国产“龙虾”们该醒醒了

01

一场早已开打的Agent战争

02

国内“龙虾”们，该醒醒了

03

国产“龙虾梦”，还能做多久？

最近内容

下一篇