AI圈都在说的新词harness，没你想的那么神秘

凯莉彭·2026年06月12日 15:25

又双叒叕造了个词

如果你关注 AI，那么你最近也许会老听到这么一个词：Harness Engineering。

打开推特、刷公众号，到处都是它。OpenAI 发文章、Anthropic 跟进、HashiCorp 的创始人在博客里推、Martin Fowler 在专栏里写。两个月之内，这个词从无人知晓变成了 AI 行业的核心词汇。

我看到的第一反应是：又一个我没跟上的概念。

老实说，我对这种感受已经有点免疫了。AI 这两年特别擅长造词：Prompt Engineering（提示词工程）、Context Engineering（上下文工程）、Agent（智能体）、RAG（检索增强生成）、MCP……

每隔一段时间，就冒出来一个新名词，配着一句潜台词："如果你不懂这个，你就落后了。"

研究完 Harness Engineering 之后，我想跟你说：

这个词没有那么神秘。事实上，你大概率早就在做这件事了，只是你不知道它叫这个名字。

今天这篇文章，就来详细聊聊这件事。

01、先把这个词翻译成人话

Harness 这个词，英文原意是马具，指的是给马套上的那一整套装备：缰绳、马鞍、嚼子、笼头。

马的特点是什么？有力气、跑得快。如果你放它自己跑，它会冲进邻居家的菜地、跑丢、撞墙。但套上马具之后，就可以让它精准地拉着马车走在你想走的路上。

把这个画面记住，因为 AI 圈现在就在用这个比喻。

行业里大家越来越喜欢用一个公式来描述现在的 AI 系统：

一个真正能干活的 AI 助手 = 模型本身 + 围绕模型搭建的整套控制系统

模型就是那匹"马"。比如 GPT、Claude、Gemini，它们提供的是智力，是推理和生成的能力。

而 Harness则是那身"马具"，也就是套在模型外面的一整套东西。规则、检验机制、可用的工具、可查的资料、出错时的反馈回路。

它告诉 AI 什么可以做、什么不能做，让 AI 知道自己做得对不对，在 AI 出错时让它能自我纠正。

模型负责"会做"，Harness 负责"做对"。

打个更接地气的比方：模型像一个非常聪明、但完全不熟悉你公司情况的实习生。Harness 就是你给这个实习生准备的"员工手册 + 工作规范 + 自动检查清单 + 出错就响的报警器"。

光有聪明的实习生没用，因为他不知道你们公司的规矩、不知道哪些事不能做、做错了也没人提醒他。你得给他套上一整套规则，他才能真正帮你把活干好。

02、一句话定义

铺垫完了，用一句话来定义一下：

Harness Engineering：你不在"让 AI 这一次做对"上花力气，而是在"让 AI 下一次、下下次、永远都不再做错这件事"上花力气。

或者用更精确一些：把 AI 犯过的某次错，永久写进它的运行环境里，让同样的错从机制上不可能再发生。

这个定义里有三个关键词，缺一不可。

一，它针对的是反复发生的问题，不是一次性的小失误。

二，解决方式是修改环境、规则、工具，不是重新跟 AI 说一遍。

三，效果是永久的、机制性的，不是这次说对了下次还得再说。

03、一个判断标准你随时可以用

下次你跟 AI 互动时，如果它做错了某件事，试试多问自己一个问题：

"我是在治这次的病，还是在断这个病的根？"

治这次的病 = 在对话里重新解释、重新提示、让它重做一遍。这不是 Harness。

断这个病的根 = 修改它的工作环境，让它从此不会再犯。这就是 Harness。

讲到这里，我猜你已经隐隐有点感觉到了，这个动作我好像做过？

是的。下面这四个场景，你看看是不是似曾相识。

场景一：你给某个 AI 工具写过指令文件

你建过 ChatGPT 的自定义指令、Claude 的用户偏好、或者 Cursor 的项目规则文件，里面写了"用中文回答""代码变量用英文""回答简洁不要废话""不准用 emoji"……每次 AI 启动都先读一遍。从此它再也不会忘。

这就是 Harness。你不是每次都临场提醒，而是把规则写进了它的工作环境。

场景二：你给 AI 配了专属知识库或者专属工作流程

你在某个 AI 工具里上传了一份公司文档、产品手册、风格指南，让它每次回答都基于这份资料。或者你在自动化工具里搭了个流程，让 AI 输出之后自动经过一个检查步骤再发给你。

这也是 Harness。你不是每次都把资料贴一遍，不是每次都人工审一遍，而是把"喂资料"和"自动检查"做进了它的运行管道。

场景三：你写过 skill，或者创建过”智能体“、”专家顾问“

你给 ChatGPT 存过一个"写朋友圈文案"的模板，你在 Claude 里建过项目把品牌指南全部写进去，你在龙虾里建过 AI 自动化流程……

这是 Harness 中最完整的一种形态。每一次模板更新，本质上就是在调整你的"马具"。把一次教训永久固化进 AI 的工作环境，让它下次不再犯。

场景四：你被 AI 坑过，然后做了点什么让它不再坑你

最朴素的版本是这样的：AI 老是把你的中文引号改成方头括号「」，你在对话里说了三次"必须用弯引号"，它没用。后来你直接把"所有引号必须是中文全角引号，禁止用其他形式的引号"写进系统提示词。

这也是 Harness。从"每次提醒"升级到"写进环境"，这就是 Harness Engineering 的核心动作。

所以你看，你不是不懂 Harness，你只是不知道这个名字。

05、这个词为什么突然就火了

时间线挺有意思的。

2026 年 2 月，HashiCorp 的联合创始人、Terraform 的创造者 Mitchell Hashimoto 在他的个人博客发了一篇文章，叫《我的 AI 使用之旅》。

文章里他用了 Harness Engineering 这个词，描述他自己摸出来的一个工作习惯：只要 AI 犯一次错，他就花时间工程化一个解决方案，让它永远不会再犯同样的错。

不是每次报错就重新喂提示词、祈祷它这次做对，而是把这次错的教训永久写进环境里。

朴素吗？极其朴素。但这句话戳中了所有做 AI 应用的人的痛点。

两周之内，OpenAI、Anthropic、LangChain 全都跟进发文。一个原本只在工程师私下用的小词，突然变成了行业共同语言。

它火得这么快，有三个原因。

第一，它命名了一件大家早就在做、但一直没有共同语言去描述的事。

你回想一下前面那四个场景，所有做 AI 工作流的人都在做这些动作，但过去没有一个统一的词来概括。现在这个词出来了，所有人都找到了语言。

第二，"写好提示词"这件事的红利期已经过去了。

过去两年大家都在卷"怎么把提示词写得更精妙"，但现在最贵的 AI 应用已经不靠单次提示词决定成败了。

它们的成败完全取决于外围环境搭得好不好。编程助手、研究助手、能自主跑数小时的工作流……都是如此。

第三，有一个让人记得住的数字。

斯坦福和清华大学的联合研究发现：同一个模型，因为外围环境（也就是 Harness）设计不同，性能差距能拉到 6 倍。

模型没变，只是脚手架变了，结果从"几乎没用"到"接近人类水平"。

6 倍。全在模型外面。

06、这意味着什么

它意味着 AI 行业正在发生一次重心转移。

从"比谁的模型更强"，转向"比谁的 Harness 搭得更好"。

过去你说"我用 GPT-4 / 我用 Claude"是一种身份。以后大家用的模型都差不多，价格越来越便宜、能力越来越接近、可替换性越来越强。

真正拉开差距的，是你给模型套的那身"马具"。

模型本身越来越像一个公共资源，谁都能用。但 Harness 是你私有的、能拉开差距的东西。

一个公司、一个团队、一个一人公司的核心竞争力，慢慢从"我用了什么模型"变成了"我围绕模型搭了什么样的工作环境"。

而这件事，任何一个用 AI 工作的人都可以开始做。不需要会写代码，不需要懂模型原理。你只需要做一件事：

下次 AI 犯了同样的错两次，可以停下来想一下，这个错该怎么解决掉，而不是再纠正一次？

Harness Engineering 听起来是个新词，但它在做的事，其实是一句普通人的老话：

同样的坑，别让我踩第二次。

唯一的区别是，过去这句话是讲给自己听的，你自己学会经验、自己记住、下次自己留心。现在你要把这句话讲给 AI 听。

也就是说，你要把"经验"用一种 AI 能读懂、能自动应用的方式，写进它的工作环境里。

提示词工程教你怎么问。

Harness Engineering 教你怎么让 AI 不用你每次都问。

AI 时代最大的效率提升，是让 AI 不再重复犯同样的错。

本文来自微信公众号“凯莉彭”，作者：凯莉彭，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

AI圈都在说的新词harness，没你想的那么神秘

01、先把这个词翻译成人话

02、一句话定义

03、一个判断标准你随时可以用

05、这个词为什么突然就火了

06、这意味着什么

最近内容

36氪AI测评

36氪寻求报道

下一篇