这个毕业季,那些被“AI毙掉的论文”

36氪的朋友们·2026年05月26日 19:36
任何足够先进的技术,都与魔法无异

“今年含AI量的审查据说更严格了。”忙着准备毕业论文的大学生小A这样说。

毕业季临近,越来越多中国大学生在提交论文前要多过一道关,AIGC检测。

这道关卡的历史并不久,据公开资料,知网的AIGC检测功能2024年才上线,AIGC 检测当时只在少数院校试点,多数学校还在观望;到2025年,超过六成本科院校、八成研究生培养单位把AIGC检测纳入论文审查流程。

但现在还没有统一标准,各校的“含AI量”红线高低不一。从已公开的通知及媒体公开报道来看,大部分学校把“含AI率”定在不超过40%,还有学校收紧到20%甚至15%。

如果论文被检测含AI量太高,要么被指导老师督促整改,严重一点的会被卡在答辩门外,甚至有极个别案例里学生因AI率过高被延期毕业,甚至取消学位资格。

毕业论文,因为AI变得更高效和简单,也因为AI变得更复杂更难应对。在时代的背景下,这是一个没有完美答案的难题。

AI检测怎么查?

从公开的高校通知看,多所高校在 AIGC 检测环节采用知网、维普、万方或其他第三方检测系统。例如,浙江大学某学院 2025 届本科毕业论文通知写明检测“对接中国知网系统”;南京财经大学 2025 届本科毕业论文通知中,论文重复率检测采用中国知网和维普,AIGC 检测则采用维普,并内嵌在毕设系统中;南京大学 2025 年通知面向学院开放“维普 AIGC 检测”,并提供学校专用登录地址;广东财经大学研究生院 2025 届通知要求统一在“中国知网”AIGC 检测通道单独上传检测。

图:南京财经大学对于论文AIGC检测的官方说明

需要区分的是,部分高校自建或委托建设的是“毕业论文管理系统”这类流程平台,主要承担论文提交、检测入口、报告流转、导师审核、版本管理等功能。底层的查重和 AIGC 判定,大多仍调用知网、维普、万方等第三方检测能力。根据已查阅到的高校官方通知,学校更多承担的是采购服务、系统接入、流程管理和规则制定角色。

但在检测方法上,几家主流厂商的公开说明大多仍停留在产品介绍层面。知网将检测产品称为“知识增强 AIGC 检测技术”,以文献大数据为基础,从“语言模式”和“语义逻辑”等链路识别中文文本中的 AI 生成内容;维普的官方说明是“基于公司研发的自主训练 AI 检测技术”,可检测DeepSeek、通义千问、文心一言、豆包等主流模型生成文本;万方“文察”系统称采用“AIGC 文本识别深度学习模型”,通过 AI 文本与人类表达在连贯性、逻辑性、结构等方面的差异进行判断。

不过,从公开页面看,这些厂商均未披露特征构成、阈值设定依据、训练数据来源、误判率、漏判率或第三方独立评测口径。也就是说,外部很难仅凭厂商介绍判断其检测能力的准确边界,也难以复核不同系统之间的可靠性差异。

在检测结果的定性上,厂商与部分高校的公开口径大多将AIGC检测定位为“辅助参考”。维普官方平台称,AIGC检测的是“论文中内容片段存在 AI 生成可能性的概率”。万方“AI 率检测”页面也提示,AIGC 值与论文质量无关,检测结果仅代表是否疑似 AI 生成,仅供参考,且可能存在误差。知网强调,检测结果中的AIGC值表示的是文章存在AI生成的概率大小,与文章质量无关。

从高校通知看,一份较为典型的毕业论文 AIGC 检测流程大致是:学生完成论文后,经指导老师确认定稿,再进入检测环节;学生或学院在本校毕业论文管理系统、指定检测平台上传论文,系统调用第三方引擎进行重复率和 AIGC 检测;检测对象通常以正文为主,标题、公式、图表、参考文献等非正文内容一般不参与检测;检测次数有限,常见为一到两次免费机会。

检测完成后,部分学校要求学生下载并提交检测报告,与论文定稿一起上传系统,经指导老师、学院或研究生院审核。若答辩前论文有改动,一些学校还要求重新检测,并强调送检版本必须与最终版本一致,否则可能被视为学术不诚信行为。也有高校要求学生提交AI使用记录。

关于AI率偏高的后果,各校处理差异较大。一类高校明确将AIGC检测结果定位为辅助参考,强调其基于算法模型的概率性分析,存在技术局限性,仅作为学术规范性辅助参考,不作为论文原创性判定依据。

图:南京大学本科生院官方通知,注明AIGC检测结果仅作为学术规范辅助性参考

另一类高校设置了明确阈值,并将阈值的判定作为警示、整改、延期答辩甚至资格处理的触发条件。比如广东财经大学研究生院规定,硕士学位论文 AIGC 检测结果超过 40% 的,由研究生院将结果反馈培养单位,并向导师和研究生发出警示,要求自查自纠、对论文进行必要修改,修改后须征得导师同意方可答辩。

合肥经济学院将“全文疑似AIGC生成率”原则上定在不超过 40%,超标后由指导老师发出警示并督促整改。黑龙江大学研究生院的规定更为严格:AIGC 生成内容比例在40%—70%的,修改论文至少6个月后方可重新申请答辩;超过70%的,取消申请学位资格。

因此,AIGC率在高校制度中的效力并不统一。传统的论文查重通常对应较明确的文字复制比红线和复检规则,而AIGC检测在不同学校中可能只是辅助参考,也可能成为整改、延期答辩或资格处理的依据。

爱恨交织的“AI科研”

在AI时代,大学教育究竟应该如何与AI共处?华中师范大学人工智能教育学部助理教授熊宇轩说:“我们平时教学和科研,也会碰到学生使用AI工具。我并不反对学生使用,甚至支持大家平日多用AI。但是在撰写论文的过程中,要合理与AI协作,批判性地使用AI,不可盲目照抄。”

但是究竟用到什么程度算合理呢?目前还没有一个统一的标准。

一位大模型算法工程师说:“AI检测判断一段文字带不带机器生成文本的统计特征。最常用的指标叫“困惑度“”(perplexity):人写东西常有跳跃、犹豫和个人化表达,局部不太稳定;模型生成的文本则更均匀、更顺滑、更高概率。检测器据此训练分类模型,去学句长分布、词汇多样性、过渡词使用这些差异。一些系统还维护一套动态更新的‘AI 特征词库’,比如‘综上所述’‘不可否认’这类高频过渡短语一旦扎堆,疑似度评分就会明显往上走。”

这套逻辑只能判断“像不像”,没法证明“是不是”。

斯坦福大学 2023 年发表在 Patterns 期刊上的一项研究给出了迄今最有力的证据:研究团队用七款主流GPT检测器评估非英语母语者的写作,结果把超过一半的TOEFL作文误判成“AI 生成”,平均误报率达61.22%。

更极端的是,91篇TOEFL作文里有 18 篇被七款检测器一致判定为 AI 生成,89 篇至少被一款标记;而它们对美国本土八年级学生作文的判断却几乎不出错。研究者的解释是,被一致误判的那些作文困惑度明显偏低,检测器可能在惩罚语言表达受限的写作者。

图:同样是人类原创,非母语者的 TOEFL 作文被七款检测器误判为"AI 生成"的比例达 48%–76%,远高于美国本土学生作文的 0%–12%。来源:Liang et al., Patterns, 2023。

“目前的AI检测只是当下为了起到一定的监督作用,让学生不要照抄AI结果,做出的一种权宜之计。但是方法绝对不能称为完美。”一位头部高校的教授说。

这种“权宜之计”,正在给学生带来现实困惑。从多位本科、硕士毕业生和在读研究生的反馈看,AI已经深度进入论文写作、课程汇报和科研训练。他们普遍认为, AI不应该替代自己完成论文,但会在一些特定的环节使用 AI。

一位研究生毕业生说,自己会用AI“理一下思路”,把混沌的想法梳理成有逻辑的框架,也会让AI润色口语化表达,使其更符合学术规范。

另一位本科毕业生把AI形容为科研任务中的“执行端”:学生先厘清研究问题、给出明确指令,再对AI生成的代码或处理结果逐项审读、校验,最后决定下一步操作。在他看来,AI可以参与执行,但审查、判断和最终决策,仍必须由学生自己负责。

不过,学生对AI的依赖程度并不一致。也有人表示,自己很少使用 AI,因为研究方向较为垂直,AI 生成内容很鸡肋。他还提到,部分已发表文章中已经能明显看出AI生成痕迹,这让他重新思考学术写作中的风气问题。

但对于高校把“AI率”作为毕业论文管理门槛,毕业生的质疑主要集中在三点:检测工具本身不够稳定,可能误伤原创内容;检测规则容易被反向适应,催生“降AI率”的应对策略;单一以AI 率为评判方法的也无法区分“AI 辅助”和“AI 代写”,与真实科研中的人机协作方式脱节。

多名毕业生提到,自己或身边同学遇到过“明明是自己写的内容,却被检测系统标红 ”的情况。一些长难句、学术化表达、程式化结构,甚至学生自己反复修改后的文本,都可能被判定为较高 AI 率。

一位在读研究生说,她已经把文本改得更接近自己的语言习惯,AI率仍然有30%多,这让她觉得检测标准和机制存在“算法黑箱”。

学生们还担心,硬性卡AI率会把注意力从提升论文质量转向“如何通过检测”。一位毕业生说,身边有同学已经在总结AIGC检测规律,例如哪些词语、句式和结构更容易被标红,并据此形成“降AI率”的策略。结果可能是,真正由 AI 生成的文本通过改写逃过检测,而人工写作的文本反而被误判。

但是大部分人理解学校的初衷,对抗“AI代笔”,守住学术评价底线。但在他们看来,学术考核真正需要辨别的,更应当是学生有没有形成问题意识、独立判断和对成果负责的能力,而不是文本在多大程度上能通过逆向审查。

因此,多位受访者认为,AI的使用已经不可避免,关键不应是简单禁止,而是界定合理边界。

部分学校要求学生填写AI使用备案或说明,但这类制度在执行中也可能遇到尴尬。一位研究生毕业生说,学校要求说明是否使用 AI、具体在哪些环节使用,一旦这样要求,很多人就会倾向于填写“没有使用”。因为一旦承认使用 AI,反而可能引发更多怀疑。

基于此,一位高校研究生建议,学校可以要求学生披露 AI 使用范围,例如是否用于资料整理、语言润色、代码生成、数据处理或观点生成;另一方面,更应该通过开题、中期检查、答辩问询、原始材料、修改记录和研究过程说明,来看论文作者是否真正理解了自己的研究。

相比一个孤立的检测比例,这些过程性证据更能反映学生是否主导了论文工作。

时代的难题

通过独立思考产出原创性的研究成果,证明自己在某个专业领域具备了独当一面的能力。这是每个毕业生在走出校门之前的最后一道关卡。

因为AI的存在,证明“原创”这件事也变得更难了。天元律师事务所合伙人李昀锴律师说:“即使从法律概念看,目前更常使用的是“独创性”,而不是“原创性”。

独创性通常包括两层含义:一是作品由作者独立完成,不是剽窃、抄袭或复制他人作品;二是作品体现了作者本人的智力投入。

放到 AI 协作场景下,关键仍然是看人类作者在其中投入了多少实质性劳动。目前相关规定并不完全明确,更多还是要结合具体个案判断。如果作者先提出论文选题、搭建框架,再使用 AI 做资料整理、查询归纳或语言润色,论文主体仍由作者完成,通常更容易被认为具有人类智力投入。”

但是毕业生基数大,如果“含AI 率”普遍推行且太过于严格,即使检测工具出现 1%的误判率,影响的范围也不小。

“那些被AI毙掉的论文”,真的可能成为一个毕业生走出大学校门之前最大的忧伤和烦恼。

“因为目前缺乏法律规定,具体可能还要参考学校本身的论文指引和管理规范。”技术的进步已经跑到了制度制定之前。学校面临的“学术审查难题”,也许不应该仅仅由学校和学生来承担。

科幻作家阿瑟·克拉克有一条广为流传的“第三定律”:任何足够先进的技术,都与魔法无异。而创造魔法的人,也有责任制造有效的缰绳。

Google DeepMind的文本水印方案 SynthID-Text 已于 2024 年 10 月发表在 Nature 正刊(Vol 634,818–823 页),论文显示它只改动模型采样过程、不影响训练,检测时也不需调用原模型,已在 Gemini 上经近 2000 万次真实交互验证,用户几乎察觉不到质量差异,Google随后将它开源。

2026年5月,OpenAI也宣布在ChatGPT、Codex等工具生成的图片中嵌入SynthID 水印,并配合C2PA来源标准使用。

我们乐于看到的是,大模型公司已经在行动,为应对时代的难题,让魔法本身变得更可控更重要。

本文来自微信公众号“腾讯科技”,作者:晓静、谢瑞瑞,36氪经授权发布。

+1
6

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

出行成本正在“温水煮青蛙”

54分钟前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业