拥抱 AGI 时代的中间层⼒量:AI 中间件的机遇与挑战

极客邦科技InfoQ·2025年08月05日 17:51
近年来,人工智能领域最引人注目的进展莫过于大模型的飞速发展。

大模型的发展趋势:

从能力跃迁到生态开放

近年来,人工智能领域最引人注目的进展莫过于大模型的飞速发展。这些模型以其惊人的学习能力和泛化能力,正在深刻改变我们对 AI 的认知,并推动着 AGI(通用人工智能)的梦想从科幻走向现实。大模型的发展呈现出两大核心趋势:模型能力的持续跃迁和模型生态的日益开放。

1.1 模型能力持续跃迁

大模型的能力提升并非一蹴而就,而是通过持续的迭代和技术创新逐步实现的。从最初的文本生成到如今的多模态理解与推理,大模型展现出越来越接近人类的智能水平。以 OpenAI 的 ChatGPT 系列为例,其演进路径清晰地描绘了这一能力跃迁的过程:

语言能力的显著增强:从 GPT 3.5 到 GPT 4,模型在语言理解、生成和逻辑推理方面取得了质的飞跃。GPT-4 在处理复杂问题、生成高质量文本以及进行多语言翻译方面表现出远超 GPT 3.5 的能力,这使得大模型能够更深入地理解语境,生成更连贯、更准确的内容。

多模态能力的突破:随着 GPT 4o 的发布,大模型不再局限于文本,开始原生支持文本、音频、图像和视频的任意组合输入与输出。这意味着模型能够同时处理和理解多种类型的数据,例如通过文字对话、上传图片或音频,让模型同时处理这些信息,从而实现更自然、更丰富的交互体验。这种多模态能力极大地拓展了 AI 的应用边界,使其能够更好地感知和理解真实世界。

推理能力的深化:OpenAI 推出的 o1 模型,则进一步强调了大模型的推理能力。o1 模型通过强化学习训练,能够在回答问题前进行“思考”,生成内部思维链,从而执行更复杂的推理任务,尤其在编程和数学推理领域表现出色。这标志着大模型正从基于知识记忆的“快思考”向具备深度逻辑分析的“慢思考”迈进,使其能够解决更具挑战性的问题。

工具使用能力的拓展:随着 o3 模型的推出,大模型开始具备自主调用和整合工具的能力。这意味着模型不仅能够理解问题,还能自主选择并使用外部工具(如网络搜索、代码执行器、数据分析工具等)来解决问题。这种能力使得 AI Agent 能够与环境进行更深层次的互动,从而实现更复杂的任务自动化。

除了 OpenAI 系列,其他领先的大模型也在各自领域展现出强大的能力。例如,Google 的 Gemini 模型以其强大的多模态推理能力著称,能够同时理解并处理文字、图片、语音等多种数据形态,并在复杂编码和分析大型数据库方面表现出色。Anthropic 的 Claude Sonnet 4 则在编程和推理方面表现优异,被认为是当今顶尖的编程助手之一。这些模型的不断涌现和能力提升,使得 AGI 的梦想不再遥远。与 IBM Watson、DeepBlue、Google AlphaGo 等专注于特定领域的 Narrow AI(狭义人工智能)不同,在 LLM(大型语言模型)的加持下,AI Agent 具备更泛化的理解、推理和规划能力,能够解决更多通用问题,有望朝通用智能方向持续演进。

1.2 模型生态日益开放

与专有模型(如 OpenAI 的闭源模型)并行发展的是开源大模型的蓬勃兴起。

开源浪潮的兴起:从 Meta 发布 LLaMA 系列开源模型开始,到国内外诸多团队先后推出开源的 QWen、DeepSeek、Kimi、Mistral 等高质量开源模型,使得大模型技术不再是少数科技巨头的专属。这些开源模型不仅提供了强大的基础能力,还允许开发者自由获取、使用和微调,极大地降低了 AI 开发的门槛。

开源模型能力的赶超:值得注意的是,部分开源模型的能力正在迅速逼近甚至在某些特定任务上赶超专有模型。例如,DeepSeek R1 和 Kimi K2 等开源模型在推理能力和代码生成方面展现出令人瞩目的表现,这种趋势使得高质量的 AI 能力不再是少数巨头的专属资源,各行各业均可低成本获取强大的模型能力。

这一趋势正在推动 AI 应用进入全面爆发期 —— 就像 Linux 打破操作系统垄断后释放的创新能量一样,开放的大模型生态正在孕育丰富多样的智能应用,为产业智能化转型注入强劲动力。

AI 应用的演进:

从聊天机器人到组织级智能体

2.1 AI 应用的演进路径

大模型能力的飞速发展,直接推动了 AI 应用形态的深刻变革。OpenAI 在内部会议中曾指出一条通往 AGI 的路径(如图 1 所示),为我们理解 AI 应用的演进提供了富有洞察力的框架 [1][2]:

Level 1: AI with conversational language capabilities (具备对话语言能力的 AI):这一阶段的 AI 主要表现为聊天机器人,能够进行流畅的文本对话,理解并回应用户的指令。早期的 ChatGPT 便是这一阶段的典型代表。

Level 2: AI with human-level problem-solving abilities (具备人类水平问题解决能力的 AI):在此阶段,AI 开始展现出更强的推理能力,能够解决复杂的数学和逻辑问题。它们不再仅仅是信息检索工具,而是能够进行深度思考和分析的“推理者”。DeepSeek R1 是这一阶段的典型代表。

Level 3: Systems that can take actions on behalf of users (能够代表用户采取行动的系统):这一阶段的 AI 被称为“智能体”(Agent),它们不仅能思考,还能通过调用工具与外部环境互动,自主完成任务。例如,通过代码执行器、浏览器等工具,AI 能够执行更广泛的操作。近期很火热的 Manus、Claude Code 等即符合此阶段定义。

Level 4: AI that can aid in invention and discovery (能够辅助发明和发现的 AI):这一层级的 AI 能够进行更深层次的创造性工作,辅助人类进行科学研究、新材料发现等。

Level 5: AI that can perform the work of an entire organization (能够执行整个组织工作的 AI):这是 AGI 的终极目标,AI 能够像一个完整的组织一样运作,自主完成各项业务流程,实现全面的智能化。

图片来源:https://www.linkedin.com/posts/gusmclennan\_openai-agi-aiprogress-activity-7238696300790038530-rmjk/

目前来看,AI 应用的发展正沿着这一趋势稳步前进。从一开始面世的 ChatGPT 聊天机器人,到后来具备联网搜索能力,再到通过思考 + 多轮检索实现深度研究,以及近期各类 Agent 应用的层出不穷,都印证了这一演进路径。

2.2 AI Agent 的爆发

最近半年,AI Agent 领域呈现出爆发式增长,涌现出大量通用型和垂直领域的智能体:

通用 Agent:例如 Manus、Genspark、ChatGPT Agent 等,它们旨在解决更广泛的通用问题,通过集成终端、浏览器、电脑等工具,为用户提供一站式服务。这些通用 Agent 在处理日常任务、信息查询、内容创作等方面展现出强大的潜力。

专业 Agent:针对特定领域,出现了大量专业性极强的 Agent,例如 Claude Code、Gemini CLI、Qwen Code 等 Coding Agent 以及 Cursor、Trae、Kiro 等 AI Coding IDE,它们能够辅助甚至自主完成代码编写、调试、测试等任务,极大地提升了开发效率。

这些 AI Agent 相比其它 AI 应用核心的差异在于它们学会了使用工具,并能与环境(如终端、浏览器、电脑)产生互动。其背后是基于强化学习微调(Reinforcement Fine-Tuning,RFT)驱动的自主学习,使得模型能够掌握如何有效地使用这些工具来解决问题。

值得一提的是,这类 Agent 在执行过程中仍保持“人类在环”(Human in the Loop):比如 ChatGPT Agent 在进行可能有重要影响的操作(如下单购买)前,会请求用户确认,Claude Code 在执行有风险的终端命令时也会停下来让用户审阅,以确保安全可控。

2.3 通用 Agent 与垂直 Agent 并存互补

随着大模型能力的增强,一个疑问随之而来:未来是否只需少数几个通用 Agent 就能通吃所有任务?还是说,不同行业仍需要各自领域的垂直 Agent?

目前业内尚无定论。但许多实践者倾向于后者,即垂直领域智能体依然有其不可替代的价值。原因在于,业务场景往往需要深度集成领域知识、专有数据和特定工具,这些属于模型外部知识与接口,需要在 Agent 层面进行整合优化。以一个企业的智能客服 Agent 为例,它需要:

深度的业务知识 (External Knowledge): 精准理解公司的产品手册、服务条款和业务流程。

个性化的用户记忆 (Memory): 了解用户的历史订单、服务偏好和沟通习惯。

专有的业务工具 (Tool): 能够调用内部的订单查询、退款处理、物流跟踪等 API。

这些与业务场景深度绑定的上下文信息,是通用 Agent 难以企及的。同时,基础模型的训练周期长、成本高,无法跟上业务的快速变化。因此,在强大的基础模型之上,构建一层能够深度集成业务知识、数据和工具的垂直 Agent,将是未来企业 AI 应用落地的必然选择。因此可以预见,未来相当长一段时间内,通用 Agent 与垂直 Agent 将并存互补:前者解决共性的问题,后者深入行业的长尾需求。

更远的未来,还可能出现具有具身智能的 Agent,即赋予 AI 更多物理世界的感官和行动能力。在文字、语音、图像之外,研究者正尝试让智能体接入嗅觉、味觉、触觉等传感器,并通过机械臂、机器人等工具来影响现实环境。

AI 应用的演进,本质上是模型与环境(浏览器、代码、API、物理世界)的互动过程。这个过程离不开模型能力的提升,但也面临着 Agent 研发、多智能体协作、RAG 效果、模型幻觉、工具使用等一系列工程化挑战。而解决这些挑战的核心,正是 AI 中间件。

AI 中间件的机遇与挑战

在分布式系统和云原生时代,中间件通过屏蔽底层复杂性、提供标准化接口,大幅提升了软件研发效率。同样地,在 AI 时代,涌现出的 AI 中间件正扮演类似的角色 —— 作为连接基础大模型和具体应用的“中间层”,为开发者提供构建智能应用所需的一系列基础能力和框架。在这部分,我们将探讨 AI 中间件所蕴含的机遇,以及在落地过程中面临的挑战。

3.1 AI 中间件的机遇

3.1.1 Agent 研发提效

开发一个功能完善的 AI Agent 涉及到模型调用、向量检索、提示词设计、工具集成、对话管理等诸多环节。AI 中间件可以提供一站式的 Agent 研发框架,将这些常用功能模块化、标准化,显著降低开发门槛。例如:

对底层 LLM 做抽象封装,方便切换不同模型。

提供 ReAct 模板以支持推理 - 行动交替的链式思考。

无缝集成 RAG(检索增强生成)、短 / 长期记忆库、以及各种外部工具插件等。

此外,考虑到 Agent 的运行通常是事件驱动、高并发但单次耗时不定,引入无服务器架构(Serverless/FaaS)作为 Agent 的运行时将大有裨益。这种模式下,当有任务请求时自动调度算力实例执行 Agent,空闲时则释放资源,可弹性扩展且降低运维成本。

再者,随着 Agent 变得越来越复杂,评估测试亦变得重要:中间件有机会提供类似单元测试(UT)或集成测试(IT)的 Agent Evaluation 框架,模拟各种环境反馈来验证 Agent 的决策和输出质量,形成研发闭环。

综合来看,围绕 Agent 全生命周期(开发 - 部署 - 监控 - 评测)提供支持,将是 AI 中间件大展身手的舞台。

3.1.2 上下文工程(Context Engineering)

构建 AI Agent 很大程度上是在工程化地管理上下文,一个 Agent 的上下文通常由多种要素构成[3]:

Instructions(指明角色和职责)

Examples(Few-shot 例子,实现 In-context learning)

External Knowledge(通过检索注入的业务知识或事实)

Memory(会话历史、用户偏好等)

Messages/Tool Results(用户的输入、工具调用的结果等)

Tool Descriptions(工具描述)

如何将这些丰富的信息高效地拼装到提示词(Prompt)中,是一门新的工程学问。

AI 中间件在这里大有可为:一方面可以提供上下文模版和编排工具,根据不同场景自动拼接出最优提示组合。另一方面可以结合模型的注意力机制特点,对上下文进行缓存和裁剪优化。例如,Manus 项目分享的经验是尽量保持 Prompt 前缀稳定,以利用 KV-Cache 提速,每次交互只增量添加新内容[4]。如图 2 所示,在多轮对话中,如果在上下文开头保持指令和既有对话不变(Cache Hit 部分),模型只需针对新增的片段计算注意力,从而大幅降低每步的推理开销。

图片来源:https://manus.im/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus

此外,也需要考虑模型最大上下文长度的限制。尽管新技术(如 DeepSeek 提出的 NSA 机制)正将上下文窗口推进到百万 Token 级别,但注意力机制的计算开销决定了上下文不可能无限增长。因此,我们还需要实现上下文压缩策略:比如对过长的历史对话进行摘要、对不变的知识内容进行索引引用而非全文嵌入,或者引入分层内存,让 Agent 在必要时自行查询长时记忆,而非每次都完整拼入上下文等。

3.1.3 记忆管理

人类智能的一大关键是记忆,同样在 AI Agent 中也需要构建类似的记忆模块。AI 中间件可以提供便捷的短期和长期记忆功能:

短期记忆主要指 Agent 在单次对话或任务过程中的信息留存,如多轮对话内容、当前需要关注的对象列表、已使用的工具结果等。

长期记忆则是跨会话、跨任务的持久记忆,如用户偏好、业务知识库、历史决策经验等。例如 Anthropic 的 Claude Code 把 CLAUDE.md 文件作为项目记忆,在每次对话开始时自动加载,里面记录了该项目的代码结构、命名风格、常用命令等信息。这样 Claude Code 在写代码时就始终牢记项目的背景知识和规范,大幅提高了配合度。同理,面向客服领域的 Agent 可能需要长期记忆用户的身份、购买历史和偏好,而面向内容创作的 Agent 则需记住以往生成的内容避免重复。

中间件可以统一管理这些不同层次的记忆:提供 API 读写用户画像或业务数据,让开发者方便地把外部记忆接入模型上下文。同时在内部实现记忆压缩和更新策略,如定期摘要长对话、淡化过时信息并强化最近互动等。

3.1.4 工具使用与扩展

如前文所述,工具调用能力是现代 AI Agent 的核心特征之一。AI 中间件在这方面的机会在于建立标准化的工具接入机制,丰富可供 Agent 使用的工具集。

Anthropic 等提出的 Model Context Protocol (MCP) 是一种探索:通过定义统一协议,任何开发者都可以将外部数据源或 API 封装成 MCP 工具,注册到 Agent 的“工具箱”中。这样,Agent 在对话中发现用户请求需要调用某工具(比如数据库查询或第三方服务)时,可以按照协议发送结构化指令给工具执行,并获取结果实时返回。

中间件有望提供类似“应用商店”的产品,聚合各种行业常用工具供 Agent 按需调用。当然,在扩充工具供给的同时也需注意安全与性能问题:应对每个接入工具进行沙箱隔离,防止恶意工具危害系统,并加入配额和超时控制,以免工具调用拖慢整体响应。

同时,Agent 在大量工具中如何选择适用的一个也是挑战。Manus 团队曾指出,如果给 Agent 插入过多工具描述,模型可能反而变“笨”,因为选择空间过大容易出错[4]。未来可能需要引入工具调度优化算法,如根据对话上下文智能筛选出相关工具供模型选择,或采用分层提示先让模型思考需要哪类工具,再从该类别中调用,以提升工具使用的准确率等。

3.1.5 沙箱环境与安全

为了让 Agent 安全地使用工具,沙箱运行环境也是必不可少。

典型场景如代码执行工具,需要在受控的沙箱中运行用户或模型生成的代码,既避免对宿主系统造成危害,也便于捕获执行结果提供给模型。在 OpenAI 的 Code Interpreter 和 Operator 中,他们为模型配置了隔离的 Python 执行环境和网络浏览器,确保模型不会直接接触生产系统而引发不可控的后果。这种机制同样适用于企业内部的 Agent 平台 —— 我们可以为每种工具制定权限,比如哪些 API 可以调用、调用频率限制等,并对敏感操作(如下单、转账)设置人工审批流程。

除了 Agent 使用外,沙箱环境也是通过强化学习微调(RFT)让模型自主学习使用工具的必要基础设施。

3.1.6 多智能体协作

当单个 Agent 无法高效完成复杂任务时,引入多个智能体分工合作是一条自然思路。AI 中间件可以提供多 Agent 管理和编排功能:

一方面,多智能体可以提升任务的并行处理能力 —— 例如在一个项目中,拆分出不同 Agent 分别负责数据收集、方案规划、执行实现等,互相协作加速完成整体任务。

另一方面,“术业有专攻”,不同 Agent 可以各自具备专长(类似人类团队中的前端工程师、后端工程师、测试工程师等角色),从而提升专业性并隔离上下文,避免一个 Agent 需要装载过多领域的知识导致认知负荷过大。

然而,多智能体系统也带来了新的复杂性,例如如何设计 Agent 之间的通信协议和共享内存,如何避免多个 Agent 重复或冲突操作,以及在大规模 Agent 集群下进行有效的调度和编排。

未来如果企业希望部署一个包含数十上百个 AI Agent 的“数字员工”团队,那么一个强大的平台来管理这些 Agent 的生命周期、权限和协作将是必不可少的。

3.1.7 多模态支持

人类智能是多模态的,AI 要真正达到类人水平,也需要处理语言、视觉、听觉甚至传感器数据等多种信息流。

最新的大模型(如 GPT-4o、Qwen2.5-Omni 等)已在架构上支持多模态输入输出,AI 中间件应该顺应这一趋势,提供多模态数据处理管道。

短期来看,Agent 研发框架可以集成图像识别、语音合成、OCR、视频理解等模块,并将它们作为工具供 Agent 调用。例如用户给 Agent 上传了一张报表截图,可以先通过 OCR 提取文字,再传给模型分析;再如用户通过语音给 Agent 下指令,通过实时转写文本供模型理解,并将模型回答以语音播放出来。这些输入输出模态的转换对于用户来说应该是无感且顺畅的。

长期来看,随着真正多模态模型的成熟,可以省去上述转换步骤,直接利用模型对原始多模态数据的处理能力。不论如何,实现流式、多模态的人机交互将极大拓展 AI 应用的边界,也是中间件需要重点支持的发展方向。

3.2 AI 中间件面临的挑战

尽管机遇广阔,AI 中间件的发展也面临诸多挑战。

3.2.1 复杂上下文的构建与优化

虽然上下文工程为 Agent 带来了灵活性,但如何管理不断膨胀的上下文是巨大的挑战。

一方面,要制定合理的上下文组装策略,确保提供给模型的信息既全面又高效。但另一方面,每个应用对上下文的偏好可能不同,如何提供足够的定制能力也是问题。

此外,随着 Agent 工具的增多和对话轮次的累积,上下文长度可能迅速逼近模型上限。因此,我们需要实现上下文裁剪和压缩机制:何时丢弃某些不再需要的历史,何时将一段对话归纳为要点等。这是一项需要平衡准确性和效率的工作。如果处理不好,可能出现知识遗忘(丢掉了还需要的信息)或语义错误(压缩导致意思改变)。因此,打造智能的上下文管理模块是中间件面临的一大挑战。

3.2.2 持久记忆的更新与利用

引入长期记忆后,新的问题随之而来 —— 如何持续更新记忆并确保正确利用?

例如客服场景下用户的个人资料可能不断变化,如果记忆模块没及时更新,会导致 Agent 基于过期信息回答。另外,当记忆越来越庞大时,检索效率和准确率都会下降。若 Agent 检索记忆时选错了条目,可能与事实不符,进而引发幻觉式回答。

因此,中间件在实现记忆库时需要攻克:记忆的组织索引(如采用向量数据库还是知识图谱,如何支持模糊查询)、记忆的演化(如何合并新信息,遗忘旧信息)以及冲突消解(当新旧记忆矛盾时如何判断可信度)等难题。这类似于人脑中的“记忆巩固”过程,需要策略地反复强化重要记忆、淡化无用记忆。

3.2.3 检索增强生成(RAG)的效果优化

RAG 技术通过检索外部知识来增强模型回答的准确性,被广泛用于企业知识问答等应用。然而 RAG 也有两个绕不过去的问题:检索质量和检索速度。

质量方面,如果文档库本身存在瑕疵(如包含错误信息或不相关内容),Agent 检索后反而会被误导。即便知识库正确,检索算法也可能因为语义匹配不佳而找错资料。

速度方面,当知识库规模巨大时,如何在毫秒级完成语义搜索是工程难点。目前的一些向量数据库和索引技术(如 HNSW、Faiss 等)能支持十万量级条目上的快速近似搜索,但面对数亿甚至更多文档时仍需分片、分层等复杂架构。

3.2.4 Agent 行为的评估测试

传统软件有完善的测试框架(单元测试、集成测试等)保障质量,而 AI Agent 的行为测试目前仍缺乏成熟的方法。

一方面,Agent 的输出具有概率性和多样性,相同输入在不同时刻可能得到不同的结果,这给定性测试带来了困难。另一方面,Agent 所处的环境是开放的(尤其能访问外部系统时),难以完全模拟所有可能的情境。

如何构建一个模拟环境或沙盒测试框架,让 Agent 在其中执行任务、收集其每一步决策,并判断对错,是中间件需要解决的难题。

3.2.5 工具使用的风险与管控

工具的双刃剑属性在挑战部分更为凸显。随着 Agent 能调用的工具从只读查询扩展到读写执行,其潜在风险也上升了。让 AI 发出 API 请求获取数据通常是安全的,但让 AI 去执行一段代码或控制物理设备,就必须慎之又慎。

首先,需要提供完善的权限控制:为不同工具设定权限边界,例如哪些文件系统路径可访问,网络请求可以访问哪些域名等。

其次,需要审计机制:应记录 Agent 使用每个工具的详细日志,以供事后审计和问题追溯。

再者,当 Agent 的操作涉及重要事务(如财务交易),必须有人类复核:这其实涉及 Human in the loop 的设计,需要考虑如何把人类的交互无缝地融入到 Agent 的工作流程中。

最后,合规也是工具使用的一部分:比如如何防止 Agent 通过浏览器获取到了用户未授权的信息等,这些都需要在中间件层面加以限制,确保 AI 的行为符合法律规范和道德标准。

简而言之,让 Agent 会用工具远远不够,还得让它安全地用、正确地用,这是中间件需要肩负的责任。

3.2.6 沙箱环境的性能与成本权衡

在机遇部分提到沙箱是必要的,但部署沙箱意味着额外的性能开销和成本负担。

在一个高实时性要求的场景,比如金融交易决策 Agent,每秒都需要进行环境感知和决策,若把其工具执行放在沙箱中可能难以满足时延要求。这就需要权衡哪些任务必须原生执行,哪些可以在沙箱异步处理。

另外,沙箱通常意味着需要模拟一个完整的运行环境,如容器或虚拟机,这带来了资源开销。当并发的 Agent 很多时,维护大量隔离环境可能消耗大量内存和 CPU,需要考虑采用更轻量的隔离技术来减轻负担。

还有安全与便利的权衡:完全断网的沙箱最安全,但有时 Agent 确实需要访问互联网。给予 Agent 自由执行命令的权限最灵活,但风险也最高。

最后,沙箱也涉及跨平台支持问题 —— 企业应用环境多种多样,Windows、Linux、云端、本地都有,如何提供一致的沙箱体验并简化配置,是产品化的考验难题。

AI 中间件的未来发展方向

短期而言,中间件的使命是解决 “AI 应用规模化” 的最后一公里问题,让开发和部署智能应用像今天开发 Web 和移动应用一样快捷高效。这包括提供更高层次的抽象、自动化的优化调优,以及降低运维成本的托管平台等。这将大大加速各行业拥抱 AI 的速度,让中小型团队也有能力打造自有的 AI 助手或产品。

长期来看,AI 中间件有潜力成为组织智能的“神经中枢”。就像人脑依赖中枢神经系统连接感官与肌肉、协调全身行动一样,一个大型组织的 AI 中间件将连接其内外部的模型、大数据和业务系统,让 AI 真正融入业务流程并产生协同效应。

面向未来十年,AI 中间件的发展才刚刚起步,其重要性和影响力会日趋凸显。从最初的聊天机器人到未来组织级智能体,我们正在见证一场技术范式的更替。就让我们拥抱这一变革,发挥中间层的力量,携手打造更智能、高效和美好的未来。

写在最后

当 AI 能力从“稀缺资源”变为“通用能力”,真正的挑战转向工程化与规模化落地。我们关注的,不是模型参数的差异,而是如何构建一个复杂、多模态、具协同行为的 AI 系统,并让它在真实世界中稳定运行。

参考资料

[1] OpenAI unveils roadmap to AGI: Agents, Innovators, and Organizationshttps://www.neowin.net/news/openai-unveils-roadmap-to-agi-agents-innovators-and-organizations

[2] Understanding OpenAI's Five Levels of AI Progress Towards AGIhttps://quinteft.com/understanding-openais-five-levels-of-ai-progress-towards-agi

[3] A Guide to Context Engineering for PMshttps://www.productcompass.pm/p/context-engineering

[4] Context Engineering for AI Agents: Lessons from Building Manushttps://manus.im/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus

本文来自微信公众号“InfoQ”(ID:infoqchina),作者:宋顺,编辑:Kitty,36氪经授权发布。

+1
6

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业