Manus和它的“8000万名员工”
迄今为止,所有关于Manus的公开讨论,几乎都未触及核心。就连刚过去的周末,唐杰、杨植麟、林俊旸、姚顺雨这四位“基模四杰”围炉聊天,聊到Manus的意义时也只是避重就轻,一笔带过。
这事儿有点反常。大概率是因为Manus现在正处在风口浪尖,大家不方便说太深。但放到今天来看,任何一场关于人工智能的讨论,要是绕开了Manus,价值都会大打折扣。
维特根斯坦说过:“凡是可以言说的,都可以说清楚。”Manus代表的技术演进方向,正好就是能说清楚的那种——它不是一次普通的技术升级,而是AI应用的“DeepSeek时刻”,标志着人工智能从“只会生成内容”转向“能自主完成任务”的范式转变。
就像当年DeepSeek问世,把开源领域的大模型应用门槛拉低,让普通人也能用上大模型一样;Manus的“多智能体系统”,靠大模型和虚拟机的巧妙结合,直接把AI变成了能自己搞定复杂任务的数字生产力。
其实不管是OpenAI、Anthropic,还是国内的DeepSeek、字节跳动,早就等着这么一个能把“AI应用”说透的时刻了。无论 Manus 如何年少乖张、误入歧途,但它摸索出的这条AI应用路径,哪怕只是灵光一现,也配得上“伟大”两个字。
Manus模式的价值,核心就三点:
1.它是人类历史上第一家拥有8000万名以上“员工”的公司;
2.其本质是一套“人工智能操作系统”;
3.它代表的技术模式最终一定会跑通,而这将意味着人类文明实现0.5个级别的跃升。
以上所言,并无虚妄。接下来,AI行业会迎来继算力之后的又一场“囚徒困境”式战争。从各种模型新势力,到BAT这些大厂,再到Meta、字节、OpenAI,还有Anthropic和DeepSeek,没人能置身事外。
01
Manus的“8000万名员工”
Manus对外披露的核心数据里,大家最关注的往往是它的年度经常性收入(ARR)突破1亿美元,还有累计处理了147万亿tokens的庞大规模。但真正能体现它模式核心的,是“创建超过8000万虚拟计算机实例”这个指标——外界常忽略这点,可这才是它的关键玄机。
拿移动互联网时代做个对比,就能看清它的颠覆性:
移动互联网时代,云计算是操作系统,支撑着数以亿计的虚拟机(也就是云服务器),这些虚拟机都是靠人来操作的。人类精英在这些虚拟机上搭建起电商、社交、短视频这些万亿级产业;
而Manus模式,是用编程语言当核心调度规则,把Claude、GPT、千问这些第三方先进大模型整合起来,在算力基础上搭建了8000万台由AI自主操作的“虚拟机”。每一台虚拟机都是一个独立的数字工作单元,能做研究、搞开发、处理自动化任务,本质上就相当于8000万个功能不同的AI员工。
这标志着核心操作者彻底变了:从人变成了AI。而支撑这种转变的Manus系统,就是AI的操作系统——多智能体系统。
再往深想,Manus模式意味着人类正在迎来一次“文明级”的生产力飞跃。
首先,所有和数字经济相关的劳动岗位,都能够被AI接管,这本身就相当于文明提升了0.5个级别;一旦算力更加充裕,AI员工从8000万扩展到8000万亿级别(当然其中的系统复杂程度也将不可同日而语),它能迸发的能量会彻底重构现有物理世界的所有生产工具。
到那时候,具身智能体(人形机器人只是其中一种)会在绝大多数领域取代人类,甚至取代现在的自动化设备,那就能带来一整个级别的文明跃升。
02
AI应用的“DeepSeek时刻”
2024年初,Anthropic发布多智能体系统的研究结果时,一组数据小小地震撼了整个行业:在多智能体架构下,Claude Opus处理复杂任务的性能,比单个智能体提升了90.2%。
这组数据背后藏着一个简单却深刻的道理:真正的智能从来都不是孤立存在的。
深度学习兴起后,AI发展一直盯着“把单个模型做强”这条路——堆更多参数、用更大的训练数据、设计更复杂的架构,似乎这是实现AGI的唯一正解。比如GPT-4的参数达到1.8万亿,Gemini Ultra搞了跨模态融合,Claude 3在长上下文理解上有突破。
但现实很残酷,这条路已经走到头了,边际效益越来越低。
多智能体系统走的是另一条路:不追求无所不能的“超级大脑”,而是打造分工明确、能协同工作的“智能社会”。在Manus的架构里,规划代理像战略家,负责读懂用户需求、制定行动方案;执行代理像专业工人,各自调用工具完成任务;验证代理像质检员,确保每个环节的结果准确。
这种分工带来的效率提升很惊人。
Anthropic的实验显示,处理那些需要并行推进、信息量超出单个模型上下文窗口的任务时,多智能体系统的表现比单智能体好90.2%。更关键的是,95%的性能差距都能归因于三个因素:token使用量(占80%)、工具调用次数和模型选择。
也就是说,多智能体靠合理分配任务、调度资源,实现了“1+1>2”的协同效果。
理论上来说,AI发展能分成三个阶段:第一阶段是感知智能,比如图像识别、语音识别;第二阶段是认知智能,比如理解语言、逻辑推理;现在正进入第三阶段——多智能。
多智能的核心不是单个智能体的能力,而是协作能力。人类文明能实现飞跃,就是从个体狩猎变成群体协作开始的。多智能体系统本质上就是在数字世界里重演这个进化过程:当多个AI能像人类团队一样分工、协作、纠错、优化时,它们解决复杂问题的能力就会发生质变。
其实之前已经有很多单点突破证明了AI的实力:DeepSeek-Math在数学推理上赢了人类选手,AutoGPT能自己完成复杂项目,Devinci的代码生成水平接近资深工程师。
而多智能体系统要做的,就是把这些“专家”组织起来,让它们协同干活。这不是技术的简单升级,而是能力的指数级爆发。
在专门评估AI处理现实复杂任务的GAIA基准测试里,Manus在所有三个难度级别都拿了最好成绩,分数超过OpenAI的DeepResearch,成了排名第一的AI助手。要知道,GAIA测试考的都是需要多步骤推理、调用外部工具、长远规划的问题,能拿第一说明Manus的能力是实打实的。
商业上的表现更能说明问题。Manus推出不到一年,年度经常性收入(ARR)就突破了1亿美元,这个成绩远超大多数SaaS初创公司的同期表现。现在还有250多万人在排队等着试用,它的两个定价档次——39美元/月的基础版和199美元/月的专业版——也把商业化路径走得很清晰。
这背后的逻辑很简单:当AI能真正代替人类完成从头到尾的复杂工作,而不只是当个辅助工具时,它的商业价值就从“提升效率”变成了“替代劳动力”。
这标志着AI应用彻底告别了“玩具”“助手”阶段,正式进入“工作者”阶段——这就是AI应用的“DeepSeek时刻”。
03
多智能体系统的几块技术基石
多智能体系统能有这么强的能力,不是凭空来的,背后靠的是多重核心技术支撑:虚拟机提供的安全执行环境、算力池化实现的高效资源利用,还有智能编排保障的协同工作流。
这些技术看着基础,甚至古旧,却是把多智能体从理论变成靠谱产品的关键。
1.虚拟机:AI的“独立工作车间”
Manus会为每个任务创建独立的云端虚拟机沙盒,这个设计解决了AI产业化的核心难题:安全和可靠。
传统AI应用常遇到“环境不兼容”的问题——生成的代码换个地方就跑不起来,调用的工具和系统冲突,一个任务出错还会影响整个系统。虚拟机技术提供了完全隔离的执行环境,让每个任务都在“干净”的环境里开始和结束,既保证了系统稳定,也能让结果重复验证。
更重要的是数据安全。企业用户最担心的就是敏感数据在AI处理时泄露或被污染。Manus的虚拟机架构做了四级安全防护:网络隔离防止数据跨任务流动,任务完成后沙盒直接销毁,确保没有数据残留,访问权限按“最少够用”原则分配,每个操作都有审计记录。
到现在,Manus至少创建了超过8000万台独立虚拟机,这个数字不仅体现了它的规模,更证明了这套架构的稳定性和可扩展性。
从云计算的角度看,这种模式很有颠覆性。”虚拟机是云服务的核心产品,随着多智能体应用爆发,它的需求肯定会大幅增长。而更重要的是,中国那些在云计算时代虚拟机技术上沉淀诸多的公司——百度、阿里、深信服们,将在新的技术竞争周期迎来又一个春天。
2. 池化与编排:聪明的“资源管家”
多智能体系统的另一个核心优势,是能智能管理资源。Manus用“分层推理”的策略,根据任务难度动态匹配模型:简单任务用Llama 3这种轻量级开源模型,复杂任务才动用Claude 3.5这种重型模型。这种精细化调度,把单个任务的token消耗降到了行业平均水平的1/3。
池化技术的核心是打破“资源孤岛”。传统AI应用常为每个功能单独部署模型,导致资源浪费。Manus建了统一的算力池和模型池,能全局调度、动态分配资源。用户提交复杂任务时,系统不会让一个超大模型包揽所有事,而是从池子里调多个合适的模型和工具,让它们各展所长、协同完成。
智能编排系统就是多智能体的“指挥中枢”,要解决一系列复杂问题:怎么把大任务拆成小任务?哪些小任务能同时做?哪些必须按顺序来?算力不够时怎么分配?任务出问题了怎么处理?
Manus的编排系统靠强化学习不断优化,分析了数千万次任务执行数据,持续改进任务拆分和资源分配的算法。
Manus的技术博客里能看出来,它背后有很强的工程化能力——比如上下文管理、稳定虚拟机环境搭建、外部应用集成这些。这些看似“不核心”的工程问题,恰恰是多智能体系统能否稳定运行的关键。
大模型的上下文窗口限制是个大难题,就算最新的模型支持100万tokens,应对真正复杂的任务还是不够。Manus用了个巧妙的上下文管理策略,只把必要的信息传给每个智能体,既保证任务信息完整,又不浪费上下文空间。
中国团队在工程实现上的优势很明显。和硅谷公司侧重算法突破不同,中国工程师更擅长把先进技术变成稳定靠谱的产品。Manus的工程能力体现在很多方面:能支持10万+任务同时运行,复杂工作流能自动重试、找替代方案,响应时间稳定可预测。这些工程细节的打磨,是多智能体从“演示demo”变成“商业产品”的必经之路。
以上逻辑上看,Manus无疑是DeepSeek之后最具突破性的AI公司。
04
下一场“囚徒困境”式AI战争
大厂必须跟进的原因,其实就三个维度:
技术上,多智能体是大模型能力的“放大器”。单个大模型再强,处理复杂任务也有局限,多智能体靠协作能突破这个瓶颈,不跟进的话,自家大模型的应用价值会大打折扣;
产品上,多智能体重新定义了人机交互方式。从“人操作AI”到“AI自主完成任务”,这种转变会催生出全新的产品形态,错过这个转变,可能就像诺基亚错过智能手机一样,从领导者变成旁观者;
生态上,多智能体平台可能成为新的生态中心。就像iOS和Android撑起了移动互联网生态一样,多智能体平台可能会成为AI应用的开发、部署和运行基础,失去这个平台地位,在AI时代就会被边缘化。
从公开的专利、人员流动和技术路线图能清楚看到,全球科技巨头都在加速布局多智能体:
国外这边,Meta不仅收购了Scale AI增强数据能力,内部的多智能体团队已经把Llama系列模型和多智能体框架结合,在内部管理任务中提升了30%的效率——虽然大模型很拉胯,但在认知水平上Meta显然是被低估的;
Google的Gemini项目本来就包含多智能体协作的思路,还公开了《AGENTS:多智能体语言模型系统开源框架》的核心架构;
微软通过Azure AI提供多智能体开发工具,还把这能力集成到Office和Dynamic 365里,想做“企业数字员工平台”;亚马逊的AWS Bedrock新增了多智能体编排功能,让企业能基于多种大模型搭建自己的系统。
国内市场也一样热闹:
一年前,阿里千问团队就被传出过于Manus存在合作,计划用打造适合中国市场的Agent系统;腾讯引人姚顺雨之后,目标非常明确,直至智能体能力;百度作为强化学习时代的领导者,在“智能体编排平台”技术领域有深厚沉淀,相关多智能体技术专利也已在2025年内曝光;
字节跳动的动向虽显神秘,但2026年继续高强度提升算力水平,也在侧面折射出其在智能体应用上存在巨大需求——豆包手机或许只是个烟雾弹,正餐大概率会是多智能体。
与此同时,最可被寄以厚望的本土模型新势力则是月之暗面(Kimi),它早在半年前就已经快速入局多智能体(OkComputer项目)。近期,这家公司完成了5亿美元的C轮融资,由IDG资本领投,估值达到30亿美元。这次融资的主要用途之一,就是“加强多智能体系统的研发和产品化”,目标是一年内实现1亿美元的ARR,复制Manus的增长路径。
如果Kimi这个目标能实现,就证明多智能体的商业模式是可复制的,到时候会有更多创业公司扎进这个领域,竞争会更激烈。
当然最重要的信号还是来自DeepSeek,多智能体系统的根据在于系统化AI编程能力——即AI的通用语言能力,当前全球最强的AI编程模型公司是Anthropic,基于这一能力,Anthropic实则已经超越OpenAI成为全球第一强的大模型公司。而据说春节前后DeepSeek将推出的新版本模型,即对标Anthropic的模型编程能力。一旦如此,中国AI多智能体应用便将少去所有技术上的后顾之忧,中国AI应用的寒武纪便将完全爆发。
05
人类角色历史性转变:从操作者到管理者
多智能体系统带来的一个深刻变化,很容易被低估:编程语言正在变成AI之间的“通用语言”,而人类和AI的关系,正在从“操作者-工具”变成“管理者-团队”。
观察Manus的工作过程会发现一个有意思的现象:用户用自然语言下达指令,但AI之间沟通,却大量用结构化、精确的“类代码”语言。规划代理传给执行代理的不是模糊的描述,而是包含函数调用、参数设置、条件判断的“任务说明书”。
这是效率的必然要求。自然语言虽然表达丰富,但容易有歧义,多个AI要精准协作,模糊的指令只会导致错误和低效。代码或类代码语言能做到无歧义表达,确保每个AI都清楚自己该做什么、要达到什么标准。
比如用户要求“分析公司财报并提取关键财务指标”,规划代理不会直接把这句话转给执行代理,而是转换成一系列精确的操作指令。这种代码化的任务描述,不仅精准,还能验证、调试、重复使用。这背后是人机协作方式的根本转变:人类不用再纠结“怎么干”,只需要说清楚“干什么”就行。
当AI能用代码级的精度理解和执行创造性任务时,人类创造性劳动的内涵就变了。传统的“创造性工作”里,其实藏着很多重复、模式化的内容:市场分析师收集数据、设计师调整布局、程序员调试代码、律师查阅案例。这些工作虽然需要专业知识,但本质上是常规执行。
多智能体系统能自动化的,正是这部分“创造性工作里的执行环节”。短期内,它们不会取代人类的战略判断、审美选择和价值取向,但能把人类从繁琐的执行里解放出来。
这会带来两个结果:一是初级、中级创造性工作的需求可能减少;二是高阶创造性工作的价值会被放大。比如AI能完成80%的常规设计任务,人类设计师就能专注于那20%需要突破性创意的部分;AI能写标准法律文件,人类律师就能更专注于复杂案件的策略和法庭辩论。
这不是职业消失,而是职业进化。就像计算机没消灭会计师,只是把他们从手工记账里解放出来,变成了财务分析师和战略顾问一样,多智能体也会重塑每一个知识型职业。
生产力的飞跃一定会带动生产关系的调整。多智能体带来的不只是效率提升,还有组织方式的根本变革。
传统企业的层级结构,是围绕人类的能力限制设计的:需要管理层定战略、中层传指令、基层执行,因为信息传递和处理能力有限。而多智能体能瞬间完成从战略解析到任务执行的全过程,企业的层级会变得越来越扁平。
更深刻的变革,在于生产资料所有权的重新定义。工业时代的核心生产资料是机器,信息时代是数据和算法,到了多智能体时代,“智能体团队”本身就成了核心生产资料。企业不用再雇佣大量人类员工组成团队,而是可以“租用”或“培养”AI智能体团队。
这种转变已经开始了。Manus的定价模式,本质上就是“数字劳动力租赁服务”:39美元/月能同时运行2个任务,199美元/月能同时运行5个任务。对中小企业来说,这意味着不用雇全职团队就能获得专业能力;对大企业来说,就能灵活调整“数字员工”规模,应对业务波动。
而生产关系变革里,最大的挑战可能是分配问题——当AI创造了大量价值,这些价值该如何在企业、用户和社会之间分配,目前还没有明确的答案。
06
被低估的风险:数据主权与系统安全
多智能体系统高歌猛进的背后,有两个核心要素被严重低估:数据和安全。它们就像数字世界的暗物质,看不见却支撑着整个系统,一旦出问题,可能从基石变成致命弱点。
传统AI里,数据主要是训练模型的“原料”——越多越好、越多样越好。Meta花143亿美元收购Scale AI 49%的股份,就是这个思路:靠高质量、大规模的标注数据提升模型性能。但在多智能体系统里,数据的角色彻底变了。
在这里,数据不只是训练原料,还是AI之间协作的“流通货币”,更是系统进化的“记忆载体”。每个任务执行过程中,规划代理的任务分解策略、执行代理的工具调用经验、验证代理的错误总结,都会以数据形式沉淀下来,变成系统的集体智慧。
Manus据称通过联邦学习建的“经验库”,已经积累了2000多个行业任务模板和千万级的任务执行记录。这些不是原始训练数据,而是结构化、可复用的“工作记忆”。遇到相似任务时,系统不用从头推理,直接调用优化过的方案,效率最高能提升60%。
这种转变带来了新问题:数据的产权和价值分配变模糊了。用户的任务需求、系统生成的执行策略,到底属于谁?用这些数据优化系统、服务其他用户时,怎么保障原用户的权益?行业现在还没形成共识,但这是多智能体商业化必须解决的根本问题。
还有个隐性风险是数据质量的“马太效应”:优质用户(能提出清晰复杂需求的专家)产生的数据质量高,能让系统在相关领域越变越好,进而吸引更多优质用户,形成正向循环;而低质量数据会让系统在某些场景下停滞甚至退化。这种分化可能加剧数字鸿沟,让多智能体变成少数人的“特权工具”。
单智能体的安全问题主要是“输入输出安全”,比如防止恶意提示、输出有害内容;但多智能体的安全挑战要复杂得多,涉及流程安全、协作安全和进化安全三个层面。
流程安全是多智能体特有的问题。一个任务拆成多个子任务让不同AI并行执行时,可能出现意想不到的风险。比如财务分析任务里,“数据收集AI”不小心爬取了敏感信息,“报告生成AI”又把这些信息写进了最终报告,导致数据泄露。单独看每个AI的行为都没问题,但组合起来就出了安全漏洞。
Manus的虚拟机沙盒能提供基础隔离,但解决不了AI之间的语义级安全问题。所以它加了“安全验证代理”,专门监控任务执行中的数据流和权限使用。但这会增加系统复杂度和成本——测试显示,完全的安全监控会让任务执行时间增加15%-30%。
协作安全更微妙。AI之间要通过通信协调工作,这个通信通道可能被攻击者利用,搞“AI间攻击”。比如攻击者通过恶意提示控制了“文件管理AI”,再让它给“数据发送AI”发伪造指令,把敏感数据传出去。这种两个授权AI之间的“合法”通信,传统安全防护很难检测。
进化安全是最棘手的挑战。多智能体系统能通过学习不断优化,但如果学习数据里混了恶意信息或异常模式,系统可能会“学坏”。更危险的是,这种“学坏”是渐进的、难察觉的,不会突然作恶,而是慢慢在边缘场景出现偏差,最后在某个临界点爆发问题。
Anthropic的研究显示,多智能体的安全风险和AI数量呈非线性增长:从单智能体涨到三智能体,已知攻击路径增加5倍;涨到五智能体,攻击路径增加23倍。这种复杂度的爆炸式增长,让传统的安全审计几乎失效。
数据和安全在多智能体系统里是“不可分割的共同体”:更多优质数据能提升系统能力,但也会扩大攻击面;更强的安全措施能保障可靠,但会限制数据流动和系统灵活性。
现在行业在探索差分隐私、同态加密、可信执行环境这些技术解决方案。Manus的企业版就有“隐私计算模块”,能让敏感数据在加密状态下被处理,AI只能拿到结果,看不到原始数据。但这会牺牲性能——加密状态下的计算速度可能下降40%-60%。
更深层的问题,是安全与效率的根本权衡。绝对安全的系统可能效率极低,高效的系统又可能存在安全漏洞。多智能体需要在两者之间找动态平衡点,而这个平衡点会随应用场景、数据类型、风险承受能力变化。
以上,这不仅是技术问题,更是治理和伦理问题。
07
多智能体的发展路径已不可逆
Manus的八千万台虚拟机,不是冰冷的数字,而是一个新型生产力时代的信号。每一台虚拟机都是一个潜在的“数字员工”,它们不知疲倦、可以无限复制、能瞬间协同,正在重新定义“工作”本身。
多智能体系统的成熟,标志着AI从“替代人类特定技能”进入了“替代完整工作流”的阶段。但这种替代不是“机器取代人”的零和游戏,而是生产力关系的范式转移。
历史有过类似的启示:ATM机的出现没消灭银行柜员,反而改变了他们的工作性质。1985到2005年,美国ATM机从10万台涨到40万台,银行柜员数量却增加了10%。变化的是工作内容——柜员从处理现金交易,变成了提供金融服务和解决问题的顾问。
多智能体时代也会重演这种转变。当AI能处理常规的流程化创造性工作时,人类的角色会向三个方向进化:任务设计者(定义AI要解决的问题)、过程监督者(确保AI工作符合要求)、价值判断者(做需要伦理考量、审美选择和战略权衡的决策)。
站在现在往前看,多智能体系统的发展路径已经很清晰了:
短期1-2年,垂直领域的多智能体应用会爆发。金融、法律、医疗、教育等行业的专业Agent会大量出现,它们不是通用AI的简化版,而是针对特定领域深度优化的专家系统。Manus的商业模式会被复制和改造,市场竞争会异常激烈。
中期3-5年,多智能体系统会从“工具”进化成“平台”。就像iOS和Android撑起了移动应用生态一样,领先的多智能体架构会成为AI应用的基础设施。
长期5-10年,人机协作会进入“融合”阶段。人类和AI的界限会变得模糊,不是靠脑机接口这种科幻技术,而是靠工作流程的深度整合。人类决策会融入AI的实时分析,AI执行会吸纳人类的即时反馈。到时候,工作不再是“人做的”或“机器做的”,而是人机系统共同完成的。
Manus的八千万虚拟员工,本质上是人类协作智慧的数字镜像。人类文明的进步,从来不是靠个体智能的飞跃,而是靠协作方式的革新——语言、文字、印刷术、互联网,每一次媒介革命都扩大了协作的规模和效率。
多智能体系统是这一进程的再一次里程碑式延伸。它第一次让机器具备了真正的协作能力——不是简单的任务并行,而是基于共同目标、分工协调、相互纠错的有机协作。当机器学会协作,它们带来的不只是效率提升,更是全新的可能性。
但这种可能性也伴随着深刻挑战。当AI能自主协作完成复杂任务时,传统的责任框架、监管模式、伦理准则都需要重新思考:谁为多智能体的集体决策负责?怎么确保它们的协作符合人类价值观?如何在享受协作红利的同时防范系统性风险?
这些问题没有简单答案,但它们定义了多智能体时代的核心议程。Manus和它的八千万虚拟员工只是序幕,真正的故事才刚刚开始。在这场人类文明的历史性重构中,技术是推动力,但人类的智慧、伦理和远见,才是决定方向的终极力量。
本文系基于公开资料撰写,仅作为信息交流之用,不构成任何投资建议。
本文来自微信公众号“锦缎”(ID:jinduan006),作者:元正,36氪经授权发布。















