AI 办公套件能帮你完成工作任务吗?

神译局·2025年12月17日 07:06
“通用型工具”对阵“专精垂直工具”,基准测试揭示真实差距。

神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。

编者按:AI 正从“辅助工具”走向“工作伙伴”,一批具备自主执行能力的智能体正在重塑办公流程。市场仍处快速变动期,但产品分化趋势已然清晰,横向平台争夺入口位置,垂直工具在专业深度上持续走强。本次基准测试覆盖 PPT、表格、邮件、调研与会议记录等核心任务,试图在回答一个关键问题——这些 AI 办公工具,究竟能在多大程度上替你完成工作?本文来自编译。

人工智能已不再仅是辅助工具,它正以“工作伙伴”的身份深度融入职场。从撰写邮件到设计幻灯片,从市场调研到搭建财务模型,一批具备自主能力的“智能体”工具正在涌现,构成了一套原生于 AI 时代的办公解决方案。

然而当前市场格局尚未稳定,几乎每周都有新产品亮相。最近 Anthropic 刚刚为 Claude 推出了文件创建与编辑功能。面对层出不穷的工具,用户难免困惑:到底该选择哪些产品?在哪些工作环节中,可以率先引入智能体工具?

为了探寻这些工具的真实表现,我们系统梳理了市场格局,并围绕电子表格、会议纪要、邮件撰写等典型办公任务,对多款AI原生工具进行了基准测试。结果显示,部分通用工具展现出广泛的应用能力,垂直类产品在特定场景中表现亮眼,而市场演进路径也逐渐清晰。

智能生产力工具两大分化路径

一边是“全能型”横向平台,致力于打造跨应用、跨任务的通用解决方案;另一边是“专精型”垂直工具,深耕邮件、幻灯片或电子表格等单一工作流。这两类产品都在飞速迭代,却各自面临着不同的取舍与挑战。

图片来源:a16z.com

全能型选手:横向平台

这类工具强调灵活通用,可跨场景执行多样任务,但在精细度与准确性上往往有所妥协。目前市场呈现三种主流形态:

通用助手

基于网页的多模态工具,支持提示词交互,部分具备记忆功能,可完成多类型任务。

  • 代表产品:Operator、Manus、Genspark

智能浏览器

具备全网自主浏览与任务执行能力。部分产品(如 Comet )还配备高级功能,例如通过关键词触发预设工作流的快捷指令。

  • 代表产品:Dia、Perplexity Comet、Browserbase

浏览器插件

轻量级辅助工具,可无缝嵌入现有工作流程与操作界面。

  • 代表产品:MaxAI、Merlin、Monica

专精型选手:垂直工具

这类产品追求专业深度与稳定可靠,不追求大而全,而是聚焦在需要高度信任、精细打磨与用户可控的结构化工作流。当前垂直工具阵营已覆盖核心职业场景:

邮件助手

专精于撰写结构化回复、智能管理收件箱及安排日程事务。

  • 代表产品:Fyxer、Serif、Jace

幻灯片制作工具

这类AI驱动工具专注于视觉设计、高效生成与灵活编辑,能快速创建演示文稿。

  • 代表产品:Gamma、Chronicle、Beautiful.ai

笔记与文档工具

专注于结构化写作、笔记记录、知识沉淀及协同编辑的智能平台。

  • 代表产品:Mem、Notion、Granola

电子表格工具

具备数据提取、格式整理与分析功能的智能应用,并可延伸至研究分析及工作流管理场景。

  • 代表产品:Paradigm、Shortcut、Meridian、Julius

AI 工具效能实测

为检验这些工具在真实场景中的表现,我们通过标准化测试评估其优势与短板。

测试任务设计涵盖六大核心维度:信息整合、沟通表达、文件解析、研究分析、策略规划与任务执行。

应用场景一:PPT 制作

测试指令:设计一份视觉冲击力强的 7 页幻灯片,主题为《2025年Z世代网络行为趋势》。

垂直类 AI 演示工具 Gamma 依托丰富模板与设计功能,能在两分钟内生成幻灯片,并允许用户灵活调整版式、字体与图表,AI助手还可随时提供文案或设计建议。

通用助手 Genspark 与 Manus 则倾向于生成内容密度更高的演示文稿,更接近研究报告,生成耗时较长,但在分析深度与指令响应方面表现更佳。ChatGPT 生成的幻灯片设计表现力较弱,效率也偏低。

值得一提的是,Claude 最新推出的文件创建功能成为测试中生成速度最快的通用智能体,尽管在设计精细度上仍有提升空间。

总体而言,若重视视觉品质与后期控制,Gamma 更优;若追求内容扎实、用于研究分析,Genspark 更合适。

应用场景二:电子表格

测试指令:从这份 PDF 中提取所有数据并计算营业利润率。

图片来源:a16z.com

表格场景对格式规范与数据精确度要求极高,尤其在处理财务模型时挑战更大。不过AI表格工具已能在基础及中级任务中发挥作用,如从 PDF 提取数据并执行运算。

本次测试中,我们上传了 S-1 招股书的一页内容,要求工具计算公司营业利润率。在横向智能体中,Manus 表现最佳,不仅将数据提取为结构化表格格式,更快速输出了准确结果。Claude 在表格任务中同样展现速度优势且答案正确,但输出内容较为局限,仅提供基础分析且未将完整数据集导入表格。

专注于 Excel 的垂直智能体 Shortcut,则在原生办公环境中提供了更全面的分析,尽管运行耗时较长,且仅提取了与计算直接相关的数据。

应用场景三:邮件处理

测试指令:起草一封邮件,协商安排下周四的晚餐约会。

图片来源:a16z.com

Fyxer、Serif 与 Jace 是专注于邮件场景的垂直助手。它们均能生成得体的邮件草稿,并在多轮对话中保持上下文连贯。其中 Serif 凭借其高度可定制性脱颖而出,支持流程模板库、邮件标签与偏好设置,让用户能够固化最佳实践,在同类场景中保持工作流一致性。

三款工具在日程安排上各有特色,但都能完成基础调度任务:

  • Serif 支持异步协调,抄送智能体即可自动处理往来协商并发送日历邀请

  • Fyxer 生成类 Calendly 预约链接供对方选择时间

  • Jace 采用轻量级方案,生成日程草稿后需用户确认才发送

相比之下,通用助手 Comet 虽然能起草回复、安排会议与搜索收件箱,但缺乏流程模板等内置定制功能,生成的邮件精准度不如专业助手。

应用场景四:信息调研

测试指令:以表格形式总结对比微软、亚马逊与谷歌最新季度的云业务营收增速并注明来源,随后撰写简短报告分析业绩背后的驱动因素。

图片来源:a16z.com

AI 工具如今能在数秒内生成专业分析,这在过去需数年经验与数小时手动劳动。测试中,所有产品均能准确抓取数据并整理为表格,差异主要体现在分析深度与响应速度。

AI 原生浏览器Comet与Dia速度最快,均在20秒内返回结果,但分析较浅、结构松散。Manus 则不仅提供完整表格,还对数据背后的驱动因素进行了深入阐释。

在信息来源方面,Comet 与 ChatGPT 引用权威性较高,直接采自财报和雅虎财经等信源,并附带文中引用,便于验证。

总体而言,取舍界限非常清晰。若追求深度分析且对处理时间不敏感,Manus 是最佳选择;若重视响应速度并满足于合格答案,Comet 则更胜一筹。

应用场景五:会议记录

测试场景:会议全程开启记事本。

图片来源:a16z.com

会议记录堪称 AI 最自然的应用场景之一,通过自动转录和内容整理,让用户能专注对话而非埋头打字。此类工具通常采用记事本模式,而 ChatGPT 的录音模式则提供了更轻量化的选择。所有测试产品均支持关键词检索,但在记录质量、定制化与协同功能上各有侧重。

  • Mem 能生成最详尽的记录,完整捕捉讨论内容与行动事项;

  • ChatGPT 录音模式则提供更精炼的总结,便于快速浏览但完整性稍逊。

  • Granola 凭借可适配不同会议类型的定制模板形成差异化,赋予用户对记录结构与输出的更高掌控力。

Granola、Mem 和 Notion 均支持会前准备笔记、会中添加指引并实时查看转录内容。其中Notion在团队协同方面表现突出,可直接在笔记中分配任务,同步至 Notion 日历,并与团队工作流无缝衔接。

总体而言,若追求全面记录可选 Mem,重视结构定制宜选 Granola,而需要团队协作则首推 Notion。

经过多轮场景测试,智能体办公生态初现雏形

差异化格局已经形成

垂直类产品凭借精致的设计界面与深度嵌入专业工作流的能力脱颖而出。它们聚焦于“表层”交互体验的打磨,特别适合需要精细呈现的对外场景。横向平台则强调广度覆盖,通过叠加关联功能竞逐“一站式入口”地位。以 Manus为例,其业务已横跨研究分析、演示文稿与电子表格三大场景,试图成为用户开启所有工作的起点。

横向平台竞争加剧

通用助手与智能浏览器正在争夺“核心工作界面”的地位。响应速度与准确性成为关键指标,更贴近模型研发的公司具备天然优势。随着 Anthropic 为 Claude 推出浏览器协作功能,我们预计 OpenAI 等主流玩家也将加快布局。

生态融合势不可挡

垂直工具与横向平台的界限正逐渐模糊。前者试图“跨域”开拓新场景,后者则持续深耕高频应用场景。对垂直领域开发者而言,及时跟进并应用最新模型技术至关重要;而横向平台构建者则需要打造足够深度的业务流程与迭代闭环,以防垂直玩家蚕食核心场景。

译者:小川

+1
51

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
资深作者

36氪旗下翻译团队。

下一篇

市场瓶颈引起的跨界商战

2025-12-16

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业