LlamaFactory创始人郑耀威:下一代Self-Evolving Agent Harness的构建实践

星连资本·2026年06月08日 17:28
LlamaFactory创始人谈支撑自我进化Agent的Harness构建经验

Agent 的能力正在从“完成一次任务”,走向“在多次任务中持续修正自己”。在这个变化中,真正决定 Agent 能否稳定运行的,不只是模型本身,还有支撑其观测、行动、状态更新与反馈评估的 Harness。 

在由T-ONE创新中心协办的「AI蓝鲸汇」闭门技术分享中,LlamaFactory 创始人郑耀威围绕《面向下一代 Self-Evolving Agent Harness 的构建实践经验分享》展开讨论。分享聚焦一个核心问题:当 Agent 不再只是完成一次性的工具调用,而是需要在多轮任务中持续观察环境、采取行动、更新状态并接受评估时,支撑它运行的 Harness 应该如何设计? 

这里的 Self-Evolving Agent Harness,可以理解为支撑 Agent 持续运行和自我校准的工程框架。它不只是把模型和工具连接起来,也不只是一次 prompt 后的执行链路,而是组织 Agent 内部状态、外部交互和反馈闭环的一套系统。 

Agent 的内部状态:

从 token、context 到 workspace

要理解Harness,首先要理解 Agent 的内部状态。郑耀威在分享中将其放在不同时间尺度上观察:最短期的是 token,模型围绕 token 进行计算,并输出下一个 token 的概率分布;再往上是 context,它承载一次对话或一次任务过程中的信息,是模型每轮推理时能够看到的上下文窗口。 

但context 有天然限制。它受长度约束,生命周期通常也局限在当前任务或当前对话中。对于复杂任务,仅依靠 context 很难完整保存任务过程、执行产物和可复用信息。 

因此,Agent 还需要 workspace。workspace 是 Agent 在完成任务过程中能够观察、读取或修改的持久区域,可能包含文件、代码、历史记录和阶段性结果。与 context 不同,workspace 可以跨任务保留,也可以承载任务执行后的长期状态。 

这个划分很关键。它意味着Agent 不再只是一次对话里的响应器,而是一个需要在短期上下文和长期工作区之间调度状态的系统。Harness 的价值,也正是在这种状态调度中体现出来。 

Harness 的核心:

让状态有组织地变化

在这个基础上,Harness 的角色开始清晰:它负责让 Agent 的状态发生有组织、可控制、可追踪的变化。 

郑耀威将其底层逻辑归纳为三类:观测、行动和状态更新。 

观测解决的是外部世界如何进入 Agent 内部状态的问题。任务输入、环境变化、历史记录、执行结果,都需要以合适的方式进入 context 或 workspace。没有清晰的观测机制,Agent 就无法知道外部发生了什么,也无法积累可用于后续任务的经验。 

行动处理的是反方向的问题。模型本身只能输出 token,不能直接改变外部环境。要把模型输出变成工具调用、文件修改、系统操作或多 Agent 协作,就需要 Harness 将模型意图转化为受控、可执行、可追踪的行动。 

状态更新则关注每次行动之后,Agent 的内部状态如何从当前状态进入下一个状态。这不仅包括 context 如何更新、裁剪或压缩,也包括 workspace 如何写入、执行记录如何沉淀、阶段性结果如何被后续任务复用。 

三类逻辑组合起来,才可能进一步支撑 planning、reflection、multi-agent 协作等更复杂的能力。 

Self-Evolving 的关键:

评估与反馈闭环

谈到 Self-Evolving Agent,郑耀威并没有把“进化”描述成抽象概念,而是回到工程闭环。 

Agent 每次执行任务,都会产生输入、输出、状态变化和任务结果。如果这些信息无法被记录、评估并回流到后续执行中,Agent 就很难在多次任务中修正自身表现。 

这里的关键是评估机制。系统需要有一把“尺子”衡量任务做得好不好,也需要把评估基准纳入 Agent 的运行体系。难点在于,不同任务对正确性的定义并不相同。垂直领域的评估,会引导 Agent 向特定领域优化;更通用的评估,才可能推动更通用的能力演化。 

用户界面中的好/坏反馈可以成为反馈来源之一,但它并不充分。一方面,这类反馈依赖人工输入,自动化程度有限;另一方面,它通常只提供结果层面的信号,未必能解释 Agent 在执行过程中到底哪里出了问题。 

因此,真正有效的反馈闭环,不能只依赖用户点选式反馈,而要结合执行轨迹、任务结果、评估基准和用户反馈。只有这些信息能够被系统化记录、分析并回流,Agent 才具备自我校准的工程基础。 

下一代 Harness 的工程启示

从工程实现看,下一代 Harness 的重点不是接入更多工具,而是把 Agent 的运行过程设计成可观测、可控制、可评估、可迭代的工程闭环。 

这意味着,系统需要显式处理几类关键问题:外部信息如何进入context 或 workspace,模型输出如何转化为受控行动,每次行动后的状态如何更新,任务结果如何被评估,评估结果和用户反馈又如何回流到后续执行中。 

郑耀威特别强调,Harness 是一个过程,而不是一个固定实物。它需要逐渐与人的需求对接,也需要在真实任务中不断迭代。对于下一代 Agent Harness 的构建而言,关键不在于包装出更复杂的外观,而在于让观测、行动、状态更新、评估和反馈真正形成长期运行机制。 

这场分享的核心启示是:Self-Evolving Agent 不只是模型能力问题,而是一个运行系统设计问题。只有把短期上下文与长期工作区的状态调度、模型输出与外部行动的执行链路,以及评估结果与用户反馈的回流机制作为整体工程来设计,Agent 才可能从单次任务执行走向多次任务中的持续进化。 

本文来自微信公众号“T-ONE创新中心”,作者:AI 蓝鲸汇,36氪经授权发布。

+1
3

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

端侧算力,成为Agent时代的入场券。

2小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业