管理:AI 时代的“超能力”

神译局·2026年03月04日 07:12
在智能体化 的AI 世界里蓬勃发展

神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。

编者按:4天从0到1,不写代码的高管凭什么跑赢整学期开发?当AI抹平门槛,“管理意图”成了最硬核的生存技能。文章来自编译。

我最近在宾夕法尼亚大学上了一门实验性课程,要求学生们在四天内从零开始创建一个创业项目。班里的大多数学生都是高管 MBA(EMBA)项目的,他们在上课的同时,还在各类大中小型公司担任医生、经理或领导者。其中几乎没有人写过代码。我向他们介绍了 Claude Code 和 Google Antigravity,让他们利用这些工具构建一个可运行的原型。但仅有原型并不等同于一家创业公司,因此他们还利用 ChatGPT、Claude 和 Gemini 来加速创意生成、市场调研、竞争定位、路演宣讲以及财务建模等流程。我很好奇他们在这么短的时间内能走多远。事实证明,他们走得非常远。

演示案例包括:由 Dee Sethmajhi、Jane Lian Wang 和 Yue Ma 开发的 Ticket Passport(一个验证票务销售市场);由 Whit Chiles、Jose Olivares 和 Spencer Louie 开发的 Revenue Resilience(识别小企业的收入风险并创建智能体解决方案);由 Manoj Massand、Samuel Lee 和 Harry Lu 开发的育儿伴侣(将孩子的兴趣与活动匹配);以及由 Angela Argentati、Sabeen Chawla 和 Adeel Rizwan 开发的 Invive(血糖预测)。(还有很多其他优秀的项目,但这几个团队授权我可以分享截图!)

我已经教了十五年的创业课,见过成千上万个创业想法(其中一些已经发展成了大型公司),所以我对一群聪明的 MBA 学生能达到什么水平有很清晰的预判。我估计,在这两天里我所看到的成果,在通往真实创业公司的道路上,比 AI 时代之前学生花一整个学期做出的东西还要超前一个数量级。大多数原型不仅仅是几个演示画面,而是真正实现了核心功能的运作。创意比以往更加多样且有趣,市场和客户分析也极具洞察力。这确实令人印象深刻。虽然这些项目还不是成熟的创业公司,也不是完全投产的产品(除了少数几个例外),但它们比传统流程节省了数月的时间、巨额的资金和巨大的精力。此外还有一点:大多数早期创业公司都需要“转型”,即在深入了解市场需求和技术可行性后调整方向。通过降低转型的成本,探索各种可能性变得容易得多,开发者不会被困在某个想法中,甚至可以同时探索多个创业项目:你只需要告诉 AI 你的需求。

我真希望这令人惊叹的成果归功于我出色的教学,但实际上我们还没有一套关于如何使用这些工具的成熟框架,学生们基本上是靠自己摸索出来的。他们拥有的管理经验和专业领域知识起到了很大作用,因为事实证明,成功的关键恰恰是上一段最后提到的那一点:告诉 AI 你想要什么。随着 AI 处理原本需要人类数小时才能完成的任务的能力越来越强,评估这些结果也变得越来越耗时,此时,“善于委派”的价值便凸显出来。但问题在于,什么时候该把工作委派给 AI 呢?

智能体化工作的方程式

我们其实已经有了答案,但情况有点复杂。需考虑三个因素:首先,由于 AI 能力存在“锯齿状边缘”(Jagged Frontier),你无法确切知道它在处理复杂任务时哪些拿手、哪些不在行。其次,无论 AI 做得好坏,它的速度绝对快,能在几分钟内完成人类需要花费数小时的工作。第三,它很便宜(相对于专业人士的工资而言),而且它并不介意你生成多个版本并扔掉其中的大部分。

这三个因素意味着,决定是否将任务委派给 AI 取决于三个变量:

  1. 人类基准时间 (Human Baseline Time): 你自己完成这项任务需要多长时间。

  2. 成功概率 (Probability of Success): AI 在单次尝试中产出符合你标准的结果的可能性有多大。

  3. AI 处理时间 (AI Process Time): 你发出请求、等待并评估 AI 输出结果所需的时间。

一个实用的思考模型可以这样:你是在“独立完成整个任务”(人类基准时间)与“支付管理开销”(AI 处理时间)之间进行权衡。你可能需要支付多次开销,直到获得满意的结果。成功概率越高,你支付 AI 处理时间的次数就越少,将任务交给 AI 的性价比就越高。举个例子,假设一项任务你自己做需要一小时,AI 几分钟就能做完,但检查答案需要三十分钟。在这种情况下,只有在成功概率极高时才应该交给 AI,否则你花在生成和检查草稿上的时间比你自己动手还要多。然而,如果人类基准时间是 10 小时,那么即使要花几个小时和 AI 磨合也是值得的,前提是 AI 最终能胜任这份工作。

这是一个针对“人类基准时间长达数小时”的任务进行的提示词示例,其初始 AI 处理时间为 30 分钟(在此期间你可以做其他事情),外加编写提示词和检查的时间。但如果你必须进行大量修正,那就不划算了。

我们知道这个方程式是奏效的,因为去年夏天,OpenAI 发布了关于 AI 与实际工作最重要的一篇论文——GDPval。我之前讨论过这篇论文,其核心在于让金融、医学、政务等不同领域的资深人类专家与最新的 AI 进行对决,并由另一组专家担任评委。专家平均需要 7 小时完成任务,因此在这种情况下,这就是“人类基准时间”。而 AI 处理时间很有意思:AI 完成任务只需几分钟,但专家实际检查工作需要一小时,当然,编写提示词也要花时间。至于“成功概率”,在 GDPval 最初发布时,评委大多判定人类胜出,但随着 GPT-5.2 的发布,天平发生了倾斜。GPT-5.2 Thinking 和 Pro 模型平均有 72% 的次数与人类专家持平或将其击败。

在“草稿 → 审核 → 必要时重试”的工作流下,AI 辅助完成 GDPval 任务带来的速度和成本提升(相对于未受辅助专家的 1x 基准)。GPT-5.2 的数据点是基于其在 GDPval 中约 72% 的胜平率进行的推测;其他模型的数据点来自 GDPval 论文。现实世界的结果会因任务而异:有些任务是“轻松取胜”,有些是明显失败,而最棘手的情况是那种“看起来没问题其实有错”的失败。

现在我们可以计算一下,在一项 7 小时的任务中,假设有 72% 的成功概率和一小时的评估时间,你能节省多少小时。如果你对每项任务都尝试编写提示词、花一小时评估 AI 结果,并在 AI 做得不好时亲自重做,那么你平均可以节省 3 小时。AI 失败的任务会花费更长时间(因为你浪费了编写和审核的时间!),但 AI 成功的任务会快得多。而且,我们还可以利用管理技巧,让这个方程式向对我们更有利的方向倾斜!

委派:提示词的新形态

为了让向 AI 委派工作更划算,我们可以通过三件事来提高成功概率并降低 AI 处理时间。首先,我们可以提供更好的指令,设定清晰的目标,让 AI 有更高的执行成功率。其次,我们可以提高评估和反馈的效率,从而减少让 AI 步入正轨所需的尝试次数。最后,我们可以简化评估过程,用更少的时间判断 AI 的表现优劣。所有这些因素都依赖于专业领域知识——专家知道该下达什么样的指令,能更敏锐地发现问题,并能更有效地纠正错误。

如果你不需要特定的结果,AI 模型在自主解决问题方面已经展现出了惊人的能力。比方说,我发现 Claude Code 仅凭一条提示词就能生成一款完整的 80 年代风格的冒险游戏。我的提示词是:“创建一个完全原创的老派 Sierra 风格冒险游戏,带有类 EGA 图形。你应该使用你的图像智能体生成图像,并为我提供一个解析器。让所有谜题都有趣且可解。完成整个游戏(游戏时长应为 10 到 15 分钟),不要问任何问题。让它变得惊艳且令人愉悦。”就这样,AI 完成了一切,包括美术。最后又用了两条提示词,它测试并部署了游戏。你可以自己玩玩看:enchanted-lighthouse-game.netlify.app。

这确实令人惊叹,但这种惊叹部分源于我并没有特定的要求,只要是一款冒险游戏,AI 可以自由发挥。但在实际工作和真正的委派中,你心中通常有一个特定的产出目标,这时情况就会变得棘手。你如何向 AI 传达你的意图,让它在运用“判断力”解决问题的同时,依然能给出你想要的产出?

这个问题在 AI 出现之前就已存在,而且它是如此普遍,以至于每个领域都发明了自己的文档格式来解决它。软件开发人员写产品需求文档(PRD);电影导演要给出分镜表;建筑师创建设计意图文件;海军陆战队使用“五段式命令”(环境、任务、执行、行政、指挥);顾问通过详细的交付物规格来界定合作范围。在如今智能体化工作的世界中,所有这些文档都是极佳的 AI 提示词(而且 AI 一次可以处理数十页的说明)。之所以可以用这么多格式来指导 AI,是因为它们的本质是一样的:尝试将一个人脑子里的想法转化为另一个人的行动。

当你观察一份优秀的委派文档包含哪些内容时,你会发现它们惊人地一致:我们想要实现什么,为什么要这样做?委派权限的边界在哪里?“完成”的标准是什么?我需要哪些特定的产出物?我需要哪些中间产出来跟踪你的进度?在告诉你已经完成之前,你需要检查哪些项?如果这些要求被明确指定,AI 就像人类一样,更有可能把工作做好。

在摸索如何向 AI 下达这些指令的过程中,事实证明,你基本上是在重新发明“管理”。

管理智能体

我发现一个很有意思的现象:大型 AI 实验室中一些最著名的软件开发人员注意到,他们的工作重心正在从编写程序转向管理 AI 智能体。编程一直具有非常严密的结构和明确的可验证产出(代码要么能运行,要么不能),因此它是 AI 工具最早成熟的领域之一,也是第一个感受到这种变革的职业。但这绝不会是最后一个。

作为一名商学院教授,我认为许多人已经拥有或者可以习得与 AI 智能体合作所需的技能——这些都是最基础的管理技能。如果你能解释清楚需求,提供有效的反馈,并设计出评估工作的方法,你就能与智能体协同工作。在许多方面,至少在你的专业领域内,这比设计那些精巧的提示词要容易得多,因为它更像是与人打交道。与此同时,管理学一直是以“稀缺性”为前提的:你之所以委派,是因为你无法独自完成所有工作,且人才资源有限且昂贵。AI 改变了这个等式。现在,“人才”是充沛且廉价的。稀缺的是——知道该要求什么。

这就是为什么我的学生表现得如此出色。他们不是 AI 专家。但他们花了数年时间学习如何在各自的专业领域界定问题、定义交付物,并识别财务模型或医疗报告何时出现了偏差。他们拥有从课堂和工作中辛苦积累的分析框架,而这些框架便成了他们的提示词。那些常被轻视为“软技能”的本领,最终被证明才是最硬核的技能。

我无法确切预知当每个人都成为拥有一支不知疲倦的智能体大军的“管理者”时,工作会变成什么样。但我猜,那些能够脱颖而出的人,将是那些知道“什么是好的产出”,并能将其解释得足够清楚,以至于连 AI 都能实现它的人。我的学生在四天内就领悟了这一点。不是因为他们是 AI 原住民,而是因为他们已经懂得如何管理。事实证明,此前所有的训练,都在无意中为他们迎接这一刻做好了准备。

译者:boxi。

+1
14

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

智能体编程的 80% 问题:过度依赖 AI 编程时的“理解债”管理

3小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业