时薪千元挖大厂前员工教会AI后一脚踹开,“多少数据公司正在把高级牛马当饲料榨干”
从咨询公司普华永道离职后,邵逸凡收到了一封看起来几乎完美的兼职工作邀请邮件,时薪高达120美元,居家办公,时间自由。
工作内容是「给AI出题」——但不是为了让它答对,而是为了让它答错,然后再手把手教会它,如何像年薪百万的「高级牛马」们一样做咨询。
高时薪、高自由度,这几乎是无数打工人梦寐以求的「神仙工作」。
可邵逸凡却给出了一个截然相反的评价:“在喂AI数据的时候,我不是牛马,我是牛马饲料。”
被AI取代之前,打工人正在牺牲自己供养AI?
问题到底出在了哪里?
邵逸凡很快发现,要想真正难倒AI,光靠编数据是远远不够的。你不能抄袭,也不能使用网上的公开案例,这一切都在暗示着,你必须把自己真正做过的项目喂给它。平台甚至会直接询问:“你是否愿意在抹掉客户信息的情况下,提供你以前做过的项目报告和模型?”但这些项目资料,是她和团队伙伴一起熬了好几个月完成的,又是客户花了几百万买断的。
最关键的是,看似体面的时薪,更像是一笔对你过往经验和知识的“一次性买断费”。她注意到,过往参与的数据标注项目,刚开始接活时任务不断,但一旦连续工作十几个小时,任务就会突然消失,“AI管你要的是无穷无尽的经验,等你自己的经验枯竭了,它就不会再给你分配新任务了”。
换句话说,如今的AI像一个不停哭闹着要吃奶的婴孩,但当它从一个人身上榨干了所有知识和经验,就会立刻转身,去找下一个人。
因此她说:“在喂AI数据的时候,我不是牛马,我是牛马饲料。AI把这些饲料全部吃完以后,变成一个更强大、更加不知疲倦的牛马,然后取代我。”
意识到这一点后,邵逸凡拒绝了这份工作,但评论区却说,“最可怕的是,只要钱给到位,你不干,总会有人干”。
打工人目前的情况相当于“被骗了还要帮人数钱”,被AI取代不是最悲惨的,最悲惨的是燃烧了自己的职业生涯,把AI喂得膘肥体壮,然后再被AI无情地一脚踹开。
如今人们逐渐认识到,AI之所以能从诗词歌赋聊到人生哲学,从写代码到模拟恋爱样样在行,并非天生全能,而是一路被人“教”出来的。
这些“老师”有一个听起来相当高级的名字:人工智能训练师。
自2020年2月起,“人工智能训练师”被正式纳入国家职业分类目录,其中一项基础但不可或缺的工作,正是“数据标注”。有报告指出,未来五年,中国数据标注领域的人才缺口可能高达百万。
所谓的数据标注,是对文本、图像、音频等原始数据进行分类、标记和注释,把人类世界里那些模糊、暧昧、只可意会的经验,一点点拆解成机器能够理解的结构和逻辑。最简单的例子,就像识别验证码那样,教会AI分辨图片中是猫是狗还是摩托车。
不过,普通人从启蒙读到大学,通常要十八年;AI从“啥都不懂”到能写论文、做咨询、当情感顾问,可能只要短短一年。
随之水涨船高的,还有对“老师”的要求——从早期的“会上网就行”,已经进化到了“985硕士以上,具备金融、医学、法律等专业背景”。
“以前总开玩笑说,被裁了就去干数据标注;现在发现,可能连标注的门槛都够不上了。”
如今的门槛究竟卷到了什么地步?在某个标价100-400元/小时的“模型专家项目”招聘介绍中,要求几乎媲美大厂社招,卡985硕士的学历,卡高壁垒的专业背景,还卡2年以上的工作经验。
一位负责多家头部企业标注人员招聘的HR也证实,近两年,标注岗位招聘要求不断提高。早期,多数岗位只要求高中或专科学历,不限经验,上手就能做;而到了今年,本科及以上学历的候选人占比已超过一半。通用类标注开始要求经验,垂直领域普遍要求专业背景,部分岗位还需要通过专业笔试。
竞争也在日益加剧,目前的招聘通过率,大约仅为二进一。
为了搞清楚入行要经历怎样的筛选,氢商业编辑在一款众包标注平台注册了账号。正式接单之前,需要上传完整简历、选择细分专业方向,并通过对应领域的专业知识测试。
以媒体方向为例,准入考试的难度,几乎可以对标高考语文。
在这里,你既是考生,也是老师。一小时的时间里,得完成约20道题,不能使用AI辅助,不能复制粘贴,只能纯靠手打,节奏相当紧凑。
考试分为两个部分。第一部分,是当阅卷老师:在同一道问题下,对比两个模型给出的回答,判断哪个更好,并说清楚原因。评判远不止于简单的字词搭配,更要像批改高考作文那样,看它是否文体得当、立意准确、逻辑通畅。
第二部分,是当出题老师:需要原创一道开放式难题,明确要求“难度超过国内模型当前水平”。和前文邵逸凡提到的工作内容类似,出题的目的就是难倒AI,也就是说,在百分制情况下,它只能拿到不足40分,比常见的60分及格线还要严苛。
出题人不仅要写出参考答案或详细考点,还要把这道题分别投喂给作为测试组和对照组的两个大语言模型,对它们的回答进行打分、对比优劣,并像一位耐心的一对二辅导老师那样,教会它们“为啥错、错在哪”。
在整个过程中,平台反复强调一个词「真实」,要求真实问题、真实情景、真实需求、真实经验。
因为真实数据,始终都是最稀缺、也最昂贵的资源。镜相工作室报道曾指出,只有不断积累来自真实世界的问题和反馈,模型才能持续进化,而专家型AI训练师,就是获取这类数据的一条“捷径”。
为此,OpenAI曾向医学、法律、语言学、计算机、物理学等领域的至少300名专家“取经”,报酬为每小时100美元,每个问题平均要花上两小时。
从成本角度看,这其实是一笔非常划算的买卖。一名高学历、具备实务经验的专家型标注员,其人力成本,往往远低于模型出错所带来的代价:自动驾驶中一个漏标的行人,可能让耗资数千万的百万公里路测功亏一篑;法律合同中的一个理解偏差,就可能引发上亿的诉讼风险。
更重要的是整体效率的提升,花两倍的价钱雇一个人,就能让他干四个人的活。比如,医学博士对CT影像的判读效率和准确性远超普通标注员,还能反过来优化数据采集与标注标准体系。
标注工作本身也在升级。它不再只是分类、画框,而是逐步走向逻辑推理、价值判断和创造性示范。最基础的接近于判断题,评估模型的回答是否正确、完整、符合逻辑;更进一步的是修改题,指出问题所在,并提供更优答案;最高级的是示范课,完整呈现一个人类专家如何拆解问题、权衡利弊,并最终做出决策的全过程。
在国内,大厂们也在走相似的路径:通过搭建专家型社区,构建更真实、更可靠的数据集。阿里推出了晓天睿士、腾讯推出了AI Expert,字节推出了Xpert,纷纷打出“专家标注,驱动AI进化”的旗号。
高薪,是上述平台最直接的吸引力。比如,阿里晓天睿士宣称时薪可达千元,几乎抵上普通白领的日薪。不过,下限是50元,还有一行小字“一切以最终项目定价为准”。
不只是兼职,正式员工的薪资也相当可观。据财经天下统计,字节跳动给AI训练岗开出了月薪2-4万元、15薪的待遇,小红书也对“AI标注产品”岗开出了2-4万元、16薪的标准。
一时间,社交媒体上,许多求职博主纷纷号召“这波秋招/春招,文科生请大胆投AI”,与此同时,各类AI训练师速成培训班也应运而生。
AI热下人人都想分一杯羹,数据标注被描绘为最低门槛、最快入门的工作,成为许多文科生试图转行AI的跳板。
最常被提及的例子,是小红书和复旦大学合作的“AI人文训练营”,和哲学、社会学等人文学科背景的高校学子一起搞实验,希望让模型更有“人味”,更懂“同理心”,随后小红书也宣布录用了一名复旦哲学博士。
“月薪三万,文科友好,但这一切真的像听上去那么‘自由而有用’吗?”
高级牛马,正在成为AI饲料?
“数据标注不值得。”
一边是培训班、训练营、专家招募如火如荼,一边是从业者避雷劝退劝得大张旗鼓。
太多的Dirty work,是它被避雷的首要原因。
在宣传里,AI训练师的工作往往被描述得很动人:你不是在打杂,而是在教机器理解人类。但落到现实里,它依旧是一条高度工业化的数据流水线。
来自复旦大学的小亚告诉Vista看天下,当用户说“我失恋了,想去旅行”时,未经训练的AI往往只会甩出交通路线和门票价格,像个不开窍的“直男”。而AI人文训练师要做的,是教AI像闺蜜一样,先大骂“渣男”,并安抚情绪说“我理解你的难过”,然后给用户推荐可以容她大哭一场的海边,而不是人挤人的网红景点。听起来很高级,但执行起来极其消耗。在工作的7个小时里,她要给AI下50-100条指令,每条往往要反复生成六七次,才能勉强选出一个“像人说的”。
图源:公众号@复旦大学
这种挫败感也源于产业链中的弱势地位。据镜相工作室报道,985硕士刘到闲正在大厂担任AI训练师,自嘲自己更像个“包工头”,主要就是承接上游算法和产品团队的需求,然后负责交付,“没有那么强的主动性,工作内容也不是特别有创造性”。更憋屈的是,当数据质量本身有问题时,她的专业判断常被忽视,反而要替模型效果背锅,“合作的产研团队,可能因为你处于下游,就表现得高高在上”。
钱,可能也没有想象的那么多。
在真正拿到标注兼职之前,很多人先经历的,是一轮又一轮免费的试标。申请时,你可能要开摄像头、开麦克风,花掉半天时间,只是为了争取一个“可能的机会”。于是,一个看起来像正经招聘的流程,实际可能是一场低成本的数据采集。
真正拿到offer的人并不多,而被骗稿、被扣钱、被以“质量不达标”等模糊理由拒付报酬的经历,却在圈内频频发生。
即便顺利上岗、远程办公,工作体验也谈不上轻松。工作界面通常自带计时器,实时监测你的屏幕状态:一段时间没有操作,就会自动暂停甚至报错。想去倒杯咖啡、上个厕所、刷一下微博,都得先手动点“暂停”——带薪摸鱼,在这里几乎不存在。
不同项目的报价差异极大,上限和下限之间往往隔着一两个数量级。公开招聘信息显示,基础兼职的日薪多在百元到几百元之间;即便是正式岗位,月薪水平也低于同级别的技术岗、产品岗和运营岗。
问题并不在于数据标注不重要,而在于它缺乏技术壁垒。每一条数据,都像玩偶身上的一针一线,很难被单独识别其价值。在这条高度标准化的生产线上,大量重复劳动难以沉淀为不可替代的能力,从业者的议价空间也就被不断压缩。
真正让人不安的,是职业前景。AI训练师们一边工作,一边怀揣着“教会徒弟,饿死老师”的不安,担心自己不过是AI进化路上的一次性耗材。
更残酷的是,训练师们亲手训练的“替代者”的确正在逐步上场。训练师Jackson告诉定焦,在一些成熟的文本模型中,由AI合成的数据已经替代了80%的人工标注。
这种不安并非杞人忧天,行业在向上狂奔的同时,也在冷静而迅速地清退早期的“基建者”。过去,媒体常常报道数据标注如何为农村妇女、残障人士等群体带来新的就业机会;但如今,这些最基础、也最脆弱的岗位,正在悄然消失。据冷杉报道,在贵州某带有扶贫性质的数据基地中,为了提高订单的效率,原本担任标注主力的“妈妈工人”的比例被要求降到25%以下。
与此同时,AI数据公司的商业模式,正在进一步放大这一职业的脆弱性。
2024 年以来,随着大模型逐渐走过“堆量训练”阶段,数据标注的边际收益开始明显递减。
高端标注成为行业瞩目的重点,但这门生意面向的客户群体极其狭窄,几乎只围绕着那几家头部大模型公司转,一旦客户更换供应商,或干脆选择自建团队,订单就会迅速缩水。更现实的是,这个行业几乎没有真正的护城河:业务高度同质化,需求零散且不断变化,过去积累的人力和经验很难在新项目中复用,标注员流失率始终居高不下。
但没有门槛的另一面,是“谁都能入场”。只要接下一小部分需求,新玩家就有机会站上牌桌,也正因如此,依旧有不少年轻的数据标注公司在缔结新的财富神话。
2025年6月,Meta创始人扎克伯格豪掷143亿美元收购数据标注公司Scale AI,28岁的创始人Alexander Wang一夜之间跻身百亿富豪之列;给邵逸凡发来工作邮件的Mercor,估值同样高达百亿美元,其创始人Brendan Foody今年才23岁。
Brendan曾直白地解释过这门生意的底层逻辑:传统行业的大公司并不愿意把数据直接交给AI公司,用来自动化自己的核心工作,用低成本的AI取代高薪咨询人才。
于是,他高薪吸引这些大企业的“前员工”,把他们身上的经验与判断,一点点榨干,训练AI。他相信,任何企业都无法拒绝一个又专业又便宜又孜孜不倦的AI牛马。在他的设想中,未来的ChatGPT将胜过最好的咨询公司,超过地球上所有最顶级的投行和律所。
而在Mercor官网,印着一行醒目的口号——“塑造未来的工作(Shape the future of work)”。
这场关于“未来工作”的重塑,正在不可逆地进行中。问题在于,在这套新体系里,人类究竟被视为长期合作者,还是一次性耗材?
至少在此刻,在点击“提交答案”的那一刻,人类仍然是那个需要为判断负责的一方。只是,没有人能确定,这个位置还能维持多久。
参考资料:
1.AI故事计划,《我,文科生,教AI回答没有标准答案的问题》,2025.05
2.Vista看天下,《这届文科生抢疯的“顶级offer”,“年薪40万,教AI说情话”》,2026.07
3.财经天下WEEKLY,《月薪3万文科友好,“AI训练师”真有那么赚?》,2025.05
4.定焦One,《给AI打工的人,迷失在数据标注里》,2025.06
5.镜相工作室,《985硕士进厂做数据标注,自嘲像个「包工头」》,2025.02
6.冷杉RECORD,《AI标注流水线上,被抛弃的“妈妈工人”》,2024.04
7.吴晓波频道,《时薪上千,大模型公司抢985文科生给AI当老师》,2025.12
8.星途旗航,《数据标注:AI产业的“核心基建”》,2025.12
封面图源|《人生切割术》剧照
本文来自微信公众号 “Vista氢商业”(ID:Qingshangye666),作者:何愚,36氪经授权发布。















