微软最新揭秘:“话痨实习生”AI助手,到底能帮人类做什么?

新智元·2025年08月19日 16:50
与AI提供的劣质服务共存

究竟哪些职业,更容易受到AI影响?基于20万微软Copilot使用数据,近日的一项研究指出,AI能够支持许多涉及研究、写作和沟通的任务,但这并不表明AI能够完全胜任任何单一职业的所有任务。

Copilot作为微软主推的AI对话工具,其积累了海量的用户数据。

而近日的一项研究,用到的数据来自24年微软Copilot对话,以及用户对AI回复是否点赞。

研究者将这些对话分类,发现用户使用AI助手频率最高的任务是获取信息,占比近40%。

其次从事与公众直接沟通的工作,例如撰写宣传稿,占比接近10%。

除此之外,使用更多的是与企业外的人员沟通,向他人解释信息,整理文档等(见图1的红色柱子)。

图1 Copilot使用情况和对应任务在工作中的占比

与之相对的,是各项任务在O*NET职业信息数据集中记录的,在各项工作中的任务占比。

两者之间存在显著的差异,这是从宏观角度,说明早期使用生成式AI的用户集中在知识工作者中。

Copolit执行的任务多是解释型的

使用过类似AI助手的工具,多半会抱怨这些工具时不时会无法按自己的要求去工作。

例如你本来想让AI来给你写个广告词,结果AI给你写出的更像一份调研报告。

在这份报告中,你会发现这样的现象普遍出现。下图左边是用户使用Copilot的目的频率,而右图是Copilot实际执行任务的频率.

结果显示:AI更侧重于「建议和教学」:AI执行的动作中「解释」类的任务尤为突出,这与用户更侧重于「获取」信息的目标形成对比。

图2 Copilot用户目标和AI实际执行动作的频率分布

当前的AI助手,如同一个读了百科全书,工作积极性超高的实习生,会习惯于解释而非按照用户真正的需求去给出解决方案。

那在哪些任务上,用户对Copilot的表现满意度最高?

图4给出的答案是在写作类任务,例如撰写书面材料,商业或艺术类写作,以及收集信息,例如调研医疗健康相关问题上,用户对生成式AI的表现满意率较高。

而在视觉设计,例如给出插图和可视化,以及处理数据类任务中,用户的满意度较低。

图3 中级工作中,用户对Copilot执行各项任务的满意比例

哪些职位和AI的适配性更高

根据当前生成式AI在那些任务上表现的不错,结合各项岗位中所需执行的任务,就可以去考察那个职业最容易被AI取代了。

该研究利用上述数据提出了一个「AI适用性评分」,试图量化每个特定职业的受AI的影响程度。

AI适用性评分考虑了AI在该领域当前的普及频率以及相关应用的成功程度。

图4右侧展示了AI适用性评分最高的25个职业。这些职业按照其AI适用性评分从高到低排序。

每个职业的条形高度代表其在美国的就业人数。

左侧列出了对上述高适用性职业贡献最大的20个「工作活动」,中间的彩色线将工作和任务相连。

图4 受AI影响最深的工作与对应的任务

结果显示:高度依赖语言、内容创作和重复性沟通任务的职业显示出最高的AI适用性。

记者、翻译、历史学家、客户支持等岗位受到的影响最大。

不过,人工智能也根本没有能够执行任何一种职业的所有工作活动。

例如下表中,销售相关的工作任务中,AI能完成的只占56%,这意味着对于许多工作,AI无法接管 100%的任务,还需要人的参与。

这无疑让很多担心自己工作被取代的职场人放心了,如今的AI可能会如同历史中的ATM取款机,自动取款机让存款取款这一银行柜员的任务自动化了,但却不是让银行柜员这个职位消失,而是导致银行柜员数量增加。

因为银行以更低的成本开设了更多分支机构,柜员更专注于更有价值的任务,即维护并建立与客户的联系,而不是处理存款和取款。

该研究还对比了人类专家认为会受到AI影响的工作,以及基于实际使用数据根据AI适配度得出的受影响工作。

图5中左上角蓝色的是人类高估AI取代风险的岗位,例如翻译。

作家被AI取代的比例被显著高估了,而另一些岗位,如历史学家、作家和政治学家,尽管高度依赖人类直觉和专业知识,并且必须处理不完整或相互矛盾的文件,最终却得到了一些相当高的AI适用性评分。

图5 AI适应性评分与人类预估的AI影响程度对比

人们会很自然的认为:与AI执行的活动高度重叠的职业将被自动化,从而经历岗位消失或工资降低,而人工智能辅助活动的职业将被增强并提高工资。

这是一个错误,当前的数据不包括AI对下游技术的影响,因此其商业影响很难预测。

此外,出人意料的是,和AI适配度最高的工作,是聚集在本科学历中的,这也反映了当前AI的智能水平。

与AI提供的劣质服务共存

看完这篇论文,笔者需指出这项研究只是基于Bing Copilot的使用数据得出的,其用户会天生偏向文字相关的任务,而对于诸如卡车驾驶之类和物理实体打交道的工作任务,则基本不会出现在使用数据中。

然而据此得出洗碗工是最难被AI取代的岗位,这就是过度引申了。

毕竟具身智能相关的技术进展,不会体现在Copliot的使用情况中。

而更让笔者忧心的是,AI将会用劣质的知识服务将我们的接收信道淹没。

如今我们见到越来越多疑似是AI生成的文章时,内心如同一潭死水,不再有一丝一毫的波澜。

这反映了AI取代人类工作所带来的更深远的影响,即AI通过提供一种劣质服务来取代人类的工作,而我们不得不与之共存。

最简单的就是客服,当我们一次次的要求转人工时,我们多么希望与我们对话的能时一个活生生的人。

更复杂一些的任务是写公文,例如给客户的道歉信,如果被发现是由AI撰写,这反而会导致舆情扩大。

这些案例都说明了AI不是要替代某项工作,而是会改变工作所需的技能和素质。

例如之前文员需要的是耐心,能稳定地完成重复性的文书撰写,而如今则是共情能力和洞察力,能够写出走心的,让人能感同身受的文字。

参考资料:

https://arxiv.org/pdf/2507.07935 

本文来自微信公众号“新智元”,作者:新智元,36氪经授权发布。

+1
6

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业