10分钟搞定Excel世锦赛难题,首个超越人类Excel Agent,网友:想给它磕一个

机器之心·2025年07月04日 11:45
这个AI让打工人「磕头」致谢。

前段时间,我们报道了5 款大模型参加了今年山东高考的事儿,为了弄清楚各大模型在 9 个科目中的具体表现,我们对着测评明细表挨个儿分析,搞得狼狈又崩溃。要是哪个 AI 能一键分析表格,我当场就能给它磕一个。

现在,终于有 AI 来整顿 Excel 表格了!

这款 AI 工具名为 Shortcut,号称是「第一个超越人类的 Excel Agent」。它能够一次性完成大多数 Excel 知识工作任务,甚至在大约 10 分钟内就解决了 Excel 世界锦标赛的复杂案例,准确率超过 80%,这比人类快 10 倍。

(冷知识:Excel 世界锦标赛(MEWC)‌是由金融建模世界杯(FMWC)团队组织、微软官方支持的全球性电子竞技赛事,参赛者需通过 Excel 解决复杂场景化题目,2024 年决赛以《魔兽世界》为模拟场景,冠军奖金 5000 美元。)

Shortcut 具有与 Excel 近乎完美的功能兼容性,可以直接编辑、导入和导出文件,它不仅限于基础 Excel 操作,还能处理复杂的金融建模任务,例如:

构建多标签的预估上限表( Pro Forma Cap Table)。

分析 5000 行 CSV 数据,生成图表和仪表板,提供深入见解。

递归解决错误,确保财务模型的准确性。

此外,它还有隐藏功能,比如画尤达大师。

据 fundamental 联合创始人 nico 演示,他只需输入提示词:帮我创作一幅精美的 50x50 像素的尤达图像,放在 B 列,通过阴影处理和色彩运用来展现它的标志性特征。Shortcut 就开始一步步执行任务,先设置像素网格,并将单元格调整为正方形,接着用各种绿色阴影创建尤达的耳朵和基本脸型。

当然,Shortcut 也有一些局限性,比如在格式化方面比较懒、在长时间多轮对话中表现不佳、处理大型 PDF 时可能遇到上下文限制。

Shortcut 目前处于早期预览阶段,大家可以在 X 上评论以获取邀请码。

邀请码获取地址:https://x.com/nicochristie/status/1940440489972649989

Shortcut 地址:http://tryshortcut.ai

我们试了一下,只要使用谷歌邮箱登录,即使没有邀请码也能获得 3 次免费体验机会。

接下来,我们就奉上一手实测。

一手体验

Shortcut 界面分为两部分,左侧类似于 Excel 表格,右侧是聊天区,输入提示词就能指使它干活。

点击左上侧的「Open Xlsx File」就能上传原始的 excel 文件,当然也可以一键新建、保存文档。

比如,我们上传了 5 款大模型挑战语文高考卷的成绩单,先让它算出各个模型对应的总分,再根据以上表格分析一下每个模型在各个题型中的得分情况。

领到任务后,它就开始咔咔思考,并像其他 Agent 一样让我们提供更多信息,比如计算的总分输入到哪一栏、分析得分情况是使用哪种形式等。确认完上述信息后,它就开始制定计划。

以下红框圈出来的部分即是 Shortcut 生成的。我专门核对了一遍,它计算的各个模型总分和相对于满分的百分比全都准确无误。

并且能根据表格准确分析出五大模型在总分、各个题型中的表现情况。

不过,我们对照右侧的任务清单,发现它也漏掉了几项,例如条形图、比较总分的柱状图以及雷达图等,翻遍了各个角落也没找到相应的图表。

难度升级。我们又上传了那个曾把我们搞得焦头烂额的各科评分明细表,让它分析这 5 款大模型在语文学科中第 23 题中的最终得分分别是多少,并形成一个表格。

好家伙,Shortcut 直接罢工:由于早期访问期间需求量大,Shortcut 正在承受压力,我们正在扩大容量,请稍后再试。我们换了几台电脑重新试了几次,还是没有起色。

我们还让它生成一个像素版马里奥图像,输入的提示词:Create a beautiful 50x50 pixel art of Mario, placed in column B, showcasing his iconic features through shadowing and color usage.

Shortcut 还是先要求细化需求,比如要创建哪个版本的马里奥、马里奥的姿势和表情等。

确认完以上细节,它立马就能响应:

来看看经典 8-bit Mario 最终效果,虽然有点抽象,但起码完成了任务。

总体来说,对于一些简单的表格生成、数据处理(比如计算总和、百分比等),Shortcut 可以轻松搞定,但如果投喂给它的表格数据过于复杂,它就很容易「宕机」。

虽然传统 Excel 是一款功能强大的工具,但其复杂性和易出错的特性让打工人痛恨已久,这也就给 Shortcut 等专门处理 Excel 任务的 Agent 巨大的发展空间,不过就目前来看,它们似乎还有较长的路要走。

参考链接:

https://x.com/nicochristie/status/1940440499393106288

本文来自微信公众号 “机器之心”(ID:almosthuman2014),作者:关注AI的,36氪经授权发布。

+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

最新文章推荐

年轻人的脱发焦虑,孕育出百亿米诺地尔大市场,谁赚翻了谁来抢食?国产折叠屏集火苹果,库克很受伤稳住淘天基本盘,阿里和京东、美团在新赛道相遇“等到Linux 6.17就「分手」,”Linus再被Bcachefs惹怒:公开要求为新特性“开后门”?过度炒作+虚假包装?Gartner预测2027年超40%的代理型AI项目将失败电商生意里,有沃尔玛的好日子和坏日子零跑、理想、小米,谁将主宰下半场?氪星晚报|微信灰测聊天记录备份优化功能,支持“自动备份”;特斯拉下调香港Model 3售价;路易威登韩国公司遭网络攻击,部分客户数据泄露中国药企在印度孵化了一家AI肿瘤医院?36氪出海·中东|卡塔尔投资促进局首席执行官会见中国贸促会会长任鸿斌
36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业