超200名谷歌外包惨被裁,员工自曝:时薪16美元、每日限时5-15分钟内完成任务、不达标就走人

CSDN·2025年09月19日 08:19
AI 热潮下的代价

随着大模型越来越聪明,AI 所呈现光环的背后,现实中却有人正在为此付出代价。

几天前,马斯克旗下的 xAI 才刚刚裁掉了500 名数据标注员工;紧接着,外媒《Wired》于近日披露,谷歌在上个月也进行了两轮“优化”,其对外包公司 GlobalLogic 的承包商进行了裁员,超过 200 名负责评估和改进谷歌旗下 AI 产品质量的合同工被突然解雇,毫无预警。

对此,一些外包员工叫苦不堪,他们称自己被裁的原因之一,是因为站出来抗议“苛刻的工作环境和廉价的薪酬”。其中还有人直言:“我们被迫训练 AI,结果它是来取代我们自己的。”

01

外包中的“AI 超级评估员”

这些外包岗位有个体面的名字,叫做AI 评估员,分为“普通”和“超级”两类。这种职位的出现,也是促使 AI 模型越来越“聪明”的重要原因之一。

他们日常的主要工作是负责审核模型的输出,看看 AI 模型给出的内容中:这句有没有跑题?这段逻辑通顺吗?两份答案哪一个更有人味?打分、改写、写建议,然后把这些反馈送回模型训练系统,用来修正和优化下一轮的输出。

正是这些看似枯燥的重复劳动,把 AI 的表达打磨得更像“人类”。也可以说,AI 在公众面前展现出的聪明与流畅,很大一部分来自这些“幕后评估员”的日复一日把关。

从行业角度来看,回看 3 年前,ChatGPT 一出场就把大模型赛道点燃,自此,各大科技公司开始迅速追赶,希望自己的大模型能排在前列,谷歌也不例外。

在这种背景下,Google 于 2023 年起便开始寻找外包公司,例如日立旗下的 GlobalLogic 、埃森哲和之前经常出现在 AI 外包新闻中的Appen,把这些关于模型评估的工作外包出去。

其中,GlobalLogic 从 2023 年起就与谷歌展开合作,并在同年春天组建了一支被称为“超级评估员”的团队,专门从搜索生成摘要(现称 AI Overviews)开始,对谷歌的 AI 产品进行深度评估。

和大家印象中的“流水线标注工”不同,这些“超级评估员”学历并不低。想加入该项目,往往需要硕士甚至博士学位。参与者中不乏作家、教师和创意工作者,他们运用专业背景来判断答案的准确性与可读性。

正因此,在他们与谷歌自家工程师团队共同努力之下,据人工智能模型排行榜 LMArena 显示,谷歌今年最新发布的推理模型Gemini 2.5 Pro甚至在部分测试中压过了 OpenAI 的 o3。

不得不说,AI 评估员对大模型的精进确实起到了不少的作用,但是对于参与其中的许多高学历背景的人才而言,现实与理想存在巨大的落差。开始这份工作之前,他们曾满怀期待,认为在 AI 大热的浪潮之下,自己参与到聊天机器人智能化的工作,就可以尽情地发挥自己的才能,带来更多的创意。

殊不知,现实却给了许多人当头一棒。

02

落差大:本以为是来进行创意工作的,结果每天是无休止的审核

其中,一位来自德克萨斯州的技术作家 Rachael Sawyer 在接受外媒采访时分享道,在 2024 年春天时候,自己的领英突然收到了 GlobalLogic公司招聘人员发来的信息,说要招聘一个写作分析师职位,具体的职责写得有些模糊。

起初,Rachael Sawyer 以为这份工作会和她之前的内容创作工作类似。不过,经过面试入职的第一天,她的预期就落空了。

Sawyer 的工作不是自己创作,而是给 AI 创作的内容进行人工打分、审核。

抱着「既来之,则安之」的心态,她想着继续在这家外包公司做一段时间试试。后来,她被安排的工作包括分析谷歌 Gemini 生成的会议记录和聊天内容,有时还需审查 AI 制作的短片。偶尔,她也要会处理一些极端内容,例如标记暴力或色情信息并要求删除。

Sawyer 说:“我很震惊,我的工作竟然涉及如此令人痛心的内容。不仅没有收到任何警告,也没签署同意书,职位描述里完全没有提到内容审核。”

随着时间推移,这类任务成了她的主业。

每天,她要在 10 分钟内完成数十项任务,这让她陷入焦虑甚至恐慌,而公司提供的心理健康支持几乎为零。

03

薪酬低:时薪 16 美元,还没有任何的福利和带薪休假

不仅如此,身为外包人员,他们的薪酬也令人咋舌。

据《卫报》报道, GlobalLogic从 2023 年开始为谷歌开展这项工作。最初公司仅招聘了 25 名超级评估员,但随着 AI 聊天对话助手竞争的加剧,团队迅速扩张至近 2,000 人,其中大多数位于美国地区,主要负责英语内容审核。

然而,他们的普通评估员时薪才 16 美元,超级评估员起薪 21 美元,远低于他们的教育背景和专业价值。

虽说在美国就业市场低迷之际,有些人只是庆幸自己能有一份工作,但也有些人表示,努力改进谷歌的 AI 产品,却得到了不成比例的回报。

一位评估员在谈到他们的受过高等教育的同事时表示:“ 他们是一群拥有专业知识、写出了很多优秀作品的人,但他们得到的报酬却低于他们的价值,在我看来,他们制作的人工智能模型是这个世界并不需要的。 ”

不仅如此,随着 AI 评估员的增多,他们的时薪还被削减了。据悉,原本 GlobalLogic 内部超级评估员时薪在 28–32 美元,而第三方合同工做同样工作仅拿 18–22 美元。

另一位叫做 Alex 的普通评估员称:“作为评估员,我们的角色至关重要,因为工程师们要处理代码等各类问题,他们没有时间去微调或获取机器人所需的反馈。我们就像海滩上的救生员——确保不会出问题。”然而,自己约 80% 的项目成员仍以合同工身份工作,还没有任何福利或带薪休假。

04

压力大:做任务的时间越来越紧、高学历的身份在 AI 大模型热潮下成为隐形人

除了以上,还有一位去年年初加入GlobalLogic的评估员回忆,她最初参与 Gemini 1.0、2.0 以及 2.5 的开发时,很高兴能理解 AI 流程,并帮助模型给出“听起来更人性化、更好的答案”。

然而,六个月后,她的任务压力骤增。

每项任务的计时从 30 分钟缩短到 15 分钟——意味着她需要在极短时间内阅读、核实事实并评估每条约 500 字的回复,有时甚至更多。

紧迫的时间让她开始质疑自己的工作质量,也开始怀疑人工智能的可靠性。

上述提到的 Alex 评估员在接受采访时也验证了这一说法,她透露,自己工作时每项任务时间甚至被设置了仅为 5 分钟,“我甚至没去数自己一天做了多少任务,我只盯着计时器。这项工作从最初的脑力激发,变成了令人麻木的重复。

她补充道,公司明确表示,如果完成不了指标,可能会失去工作或整个项目。

对此,多位负责谷歌 AI 的评估员坦言,他们感到失望:工作孤立、期限紧迫,且自己推出的产品并不总是安全可靠。

在谷歌内部,这些评估员处于尴尬的中间层级——隐形、必不可少,却又可有可无

然而,谷歌之前却在一份在声明中表示:“质量评估员受雇于我们的供应商,为产品提供外部反馈。他们的评级只是众多汇总数据点之一,不会直接影响我们的算法或模型。”

05

“没有任何预警,我被裁了”

付出了辛苦的劳动,承受着巨大压力做 AI 评估员这份工作之后,真正令人心寒的是——“毫无预警之下,自己就被裁掉了。”

负责对 AI 输出评分并设计各种提示的 Andrew Lauzon 就是被裁的员工之一,他在 8 月 15 日收到终止合同的邮件。

“我追问了为什么,他们只说项目缩减——没有解释那是什么意思。”

Lauzon 表示,这一举措凸显了此类内容审核工作的不稳定性。他称 GlobalLogic 从今年开始就已开始定期裁员。“当我们知道随时可能被解雇时,又怎能感到这份工作有安全感呢?”

仍在公司的员工表示,他们越来越担心自己训练出来的 AI 系统,最终可能会取代自己。

对此,据外媒 WIRED 报道,谷歌找的这家外包公司 GlobalLogic 正在利用人工评分员的数据训练 AI,使系统能够自动评分,逐步替代人工。截至目前,GlobalLogic 内部的 AI 超级评估员和普通评估员的总数已缩减至约 1500 人。

06

AI 热潮下的代价

面对这波裁员浪潮, 谷歌发言人回应称:“这些员工是 GlobalLogic 及其分包商的雇员,而非 Alphabet(谷歌母公司)的员工。作为雇主,GlobalLogic 及其分包商应对其员工的雇佣事宜与工作条件负责。我们重视与供应商的合作关系,并会依据《供应商行为准则》对合作企业进行审核。”

事实上,从 xAI 到谷歌的供应商,AI 行业的裁员浪潮仍在持续。这背后折射出一个现实:AI 的崛起并非一夜之间,而是建立在人类长期的经验与贡献之上。但随着技术的快速迭代和自动化程度的提升,部分人也不可避免地成为最先受到冲击的群体。

与其被动担忧,不如主动迎接。既然无法阻挡浪潮,就尽早升级自己的 AI 技能,把潜在的劣势转化为新的优势,这或许才是更务实的选择。

本文来自微信公众号“CSDN”,作者:苏宓,36氪经授权发布。

+1
2

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

为什么在他的字典里,没有“不可能”?

3小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业