LlamaFactory创始人郑耀威：下一代Self-Evolving Agent Harness的构建实践

星连资本·2026年06月08日 17:28

LlamaFactory创始人谈支撑自我进化Agent的Harness构建经验

Agent 的能力正在从“完成一次任务”，走向“在多次任务中持续修正自己”。在这个变化中，真正决定 Agent 能否稳定运行的，不只是模型本身，还有支撑其观测、行动、状态更新与反馈评估的 Harness。

在由T-ONE创新中心协办的「AI蓝鲸汇」闭门技术分享中，LlamaFactory 创始人郑耀威围绕《面向下一代 Self-Evolving Agent Harness 的构建实践经验分享》展开讨论。分享聚焦一个核心问题：当 Agent 不再只是完成一次性的工具调用，而是需要在多轮任务中持续观察环境、采取行动、更新状态并接受评估时，支撑它运行的 Harness 应该如何设计？

这里的 Self-Evolving Agent Harness，可以理解为支撑 Agent 持续运行和自我校准的工程框架。它不只是把模型和工具连接起来，也不只是一次 prompt 后的执行链路，而是组织 Agent 内部状态、外部交互和反馈闭环的一套系统。

Agent 的内部状态：

从 token、context 到 workspace

要理解Harness，首先要理解 Agent 的内部状态。郑耀威在分享中将其放在不同时间尺度上观察：最短期的是 token，模型围绕 token 进行计算，并输出下一个 token 的概率分布；再往上是 context，它承载一次对话或一次任务过程中的信息，是模型每轮推理时能够看到的上下文窗口。

但context 有天然限制。它受长度约束，生命周期通常也局限在当前任务或当前对话中。对于复杂任务，仅依靠 context 很难完整保存任务过程、执行产物和可复用信息。

因此，Agent 还需要 workspace。workspace 是 Agent 在完成任务过程中能够观察、读取或修改的持久区域，可能包含文件、代码、历史记录和阶段性结果。与 context 不同，workspace 可以跨任务保留，也可以承载任务执行后的长期状态。

这个划分很关键。它意味着Agent 不再只是一次对话里的响应器，而是一个需要在短期上下文和长期工作区之间调度状态的系统。Harness 的价值，也正是在这种状态调度中体现出来。

Harness 的核心：

让状态有组织地变化

在这个基础上，Harness 的角色开始清晰：它负责让 Agent 的状态发生有组织、可控制、可追踪的变化。

郑耀威将其底层逻辑归纳为三类：观测、行动和状态更新。

观测解决的是外部世界如何进入 Agent 内部状态的问题。任务输入、环境变化、历史记录、执行结果，都需要以合适的方式进入 context 或 workspace。没有清晰的观测机制，Agent 就无法知道外部发生了什么，也无法积累可用于后续任务的经验。

行动处理的是反方向的问题。模型本身只能输出 token，不能直接改变外部环境。要把模型输出变成工具调用、文件修改、系统操作或多 Agent 协作，就需要 Harness 将模型意图转化为受控、可执行、可追踪的行动。

状态更新则关注每次行动之后，Agent 的内部状态如何从当前状态进入下一个状态。这不仅包括 context 如何更新、裁剪或压缩，也包括 workspace 如何写入、执行记录如何沉淀、阶段性结果如何被后续任务复用。

三类逻辑组合起来，才可能进一步支撑 planning、reflection、multi-agent 协作等更复杂的能力。

Self-Evolving 的关键：

评估与反馈闭环

谈到 Self-Evolving Agent，郑耀威并没有把“进化”描述成抽象概念，而是回到工程闭环。

Agent 每次执行任务，都会产生输入、输出、状态变化和任务结果。如果这些信息无法被记录、评估并回流到后续执行中，Agent 就很难在多次任务中修正自身表现。

这里的关键是评估机制。系统需要有一把“尺子”衡量任务做得好不好，也需要把评估基准纳入 Agent 的运行体系。难点在于，不同任务对正确性的定义并不相同。垂直领域的评估，会引导 Agent 向特定领域优化；更通用的评估，才可能推动更通用的能力演化。

用户界面中的好/坏反馈可以成为反馈来源之一，但它并不充分。一方面，这类反馈依赖人工输入，自动化程度有限；另一方面，它通常只提供结果层面的信号，未必能解释 Agent 在执行过程中到底哪里出了问题。

因此，真正有效的反馈闭环，不能只依赖用户点选式反馈，而要结合执行轨迹、任务结果、评估基准和用户反馈。只有这些信息能够被系统化记录、分析并回流，Agent 才具备自我校准的工程基础。

下一代 Harness 的工程启示

从工程实现看，下一代 Harness 的重点不是接入更多工具，而是把 Agent 的运行过程设计成可观测、可控制、可评估、可迭代的工程闭环。

这意味着，系统需要显式处理几类关键问题：外部信息如何进入context 或 workspace，模型输出如何转化为受控行动，每次行动后的状态如何更新，任务结果如何被评估，评估结果和用户反馈又如何回流到后续执行中。

郑耀威特别强调，Harness 是一个过程，而不是一个固定实物。它需要逐渐与人的需求对接，也需要在真实任务中不断迭代。对于下一代 Agent Harness 的构建而言，关键不在于包装出更复杂的外观，而在于让观测、行动、状态更新、评估和反馈真正形成长期运行机制。

这场分享的核心启示是：Self-Evolving Agent 不只是模型能力问题，而是一个运行系统设计问题。只有把短期上下文与长期工作区的状态调度、模型输出与外部行动的执行链路，以及评估结果与用户反馈的回流机制作为整体工程来设计，Agent 才可能从单次任务执行走向多次任务中的持续进化。

本文来自微信公众号“T-ONE创新中心”，作者：AI 蓝鲸汇，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

LlamaFactory创始人郑耀威：下一代Self-Evolving Agent Harness的构建实践

最近内容

36氪AI测评

36氪寻求报道

提及的机构

下一篇