这个毕业季，那些被“AI毙掉的论文”

36氪的朋友们·2026年05月26日 19:36

任何足够先进的技术，都与魔法无异

“今年含AI量的审查据说更严格了。”忙着准备毕业论文的大学生小A这样说。

毕业季临近，越来越多中国大学生在提交论文前要多过一道关，AIGC检测。

这道关卡的历史并不久，据公开资料，知网的AIGC检测功能2024年才上线，AIGC 检测当时只在少数院校试点，多数学校还在观望；到2025年，超过六成本科院校、八成研究生培养单位把AIGC检测纳入论文审查流程。

但现在还没有统一标准，各校的“含AI量”红线高低不一。从已公开的通知及媒体公开报道来看，大部分学校把“含AI率”定在不超过40%，还有学校收紧到20%甚至15%。

如果论文被检测含AI量太高，要么被指导老师督促整改，严重一点的会被卡在答辩门外，甚至有极个别案例里学生因AI率过高被延期毕业，甚至取消学位资格。

毕业论文，因为AI变得更高效和简单，也因为AI变得更复杂更难应对。在时代的背景下，这是一个没有完美答案的难题。

AI检测怎么查？

从公开的高校通知看，多所高校在 AIGC 检测环节采用知网、维普、万方或其他第三方检测系统。例如，浙江大学某学院 2025 届本科毕业论文通知写明检测“对接中国知网系统”；南京财经大学 2025 届本科毕业论文通知中，论文重复率检测采用中国知网和维普，AIGC 检测则采用维普，并内嵌在毕设系统中；南京大学 2025 年通知面向学院开放“维普 AIGC 检测”，并提供学校专用登录地址；广东财经大学研究生院 2025 届通知要求统一在“中国知网”AIGC 检测通道单独上传检测。

图：南京财经大学对于论文AIGC检测的官方说明

需要区分的是，部分高校自建或委托建设的是“毕业论文管理系统”这类流程平台，主要承担论文提交、检测入口、报告流转、导师审核、版本管理等功能。底层的查重和 AIGC 判定，大多仍调用知网、维普、万方等第三方检测能力。根据已查阅到的高校官方通知，学校更多承担的是采购服务、系统接入、流程管理和规则制定角色。

但在检测方法上，几家主流厂商的公开说明大多仍停留在产品介绍层面。知网将检测产品称为“知识增强 AIGC 检测技术”，以文献大数据为基础，从“语言模式”和“语义逻辑”等链路识别中文文本中的 AI 生成内容；维普的官方说明是“基于公司研发的自主训练 AI 检测技术”，可检测DeepSeek、通义千问、文心一言、豆包等主流模型生成文本；万方“文察”系统称采用“AIGC 文本识别深度学习模型”，通过 AI 文本与人类表达在连贯性、逻辑性、结构等方面的差异进行判断。

不过，从公开页面看，这些厂商均未披露特征构成、阈值设定依据、训练数据来源、误判率、漏判率或第三方独立评测口径。也就是说，外部很难仅凭厂商介绍判断其检测能力的准确边界，也难以复核不同系统之间的可靠性差异。

在检测结果的定性上，厂商与部分高校的公开口径大多将AIGC检测定位为“辅助参考”。维普官方平台称，AIGC检测的是“论文中内容片段存在 AI 生成可能性的概率”。万方“AI 率检测”页面也提示，AIGC 值与论文质量无关，检测结果仅代表是否疑似 AI 生成，仅供参考，且可能存在误差。知网强调，检测结果中的AIGC值表示的是文章存在AI生成的概率大小，与文章质量无关。

从高校通知看，一份较为典型的毕业论文 AIGC 检测流程大致是：学生完成论文后，经指导老师确认定稿，再进入检测环节；学生或学院在本校毕业论文管理系统、指定检测平台上传论文，系统调用第三方引擎进行重复率和 AIGC 检测；检测对象通常以正文为主，标题、公式、图表、参考文献等非正文内容一般不参与检测；检测次数有限，常见为一到两次免费机会。

检测完成后，部分学校要求学生下载并提交检测报告，与论文定稿一起上传系统，经指导老师、学院或研究生院审核。若答辩前论文有改动，一些学校还要求重新检测，并强调送检版本必须与最终版本一致，否则可能被视为学术不诚信行为。也有高校要求学生提交AI使用记录。

关于AI率偏高的后果，各校处理差异较大。一类高校明确将AIGC检测结果定位为辅助参考，强调其基于算法模型的概率性分析，存在技术局限性，仅作为学术规范性辅助参考，不作为论文原创性判定依据。

图：南京大学本科生院官方通知，注明AIGC检测结果仅作为学术规范辅助性参考

另一类高校设置了明确阈值，并将阈值的判定作为警示、整改、延期答辩甚至资格处理的触发条件。比如广东财经大学研究生院规定，硕士学位论文 AIGC 检测结果超过 40% 的，由研究生院将结果反馈培养单位，并向导师和研究生发出警示，要求自查自纠、对论文进行必要修改，修改后须征得导师同意方可答辩。

合肥经济学院将“全文疑似AIGC生成率”原则上定在不超过 40%，超标后由指导老师发出警示并督促整改。黑龙江大学研究生院的规定更为严格：AIGC 生成内容比例在40%—70%的，修改论文至少6个月后方可重新申请答辩；超过70%的，取消申请学位资格。

因此，AIGC率在高校制度中的效力并不统一。传统的论文查重通常对应较明确的文字复制比红线和复检规则，而AIGC检测在不同学校中可能只是辅助参考，也可能成为整改、延期答辩或资格处理的依据。

爱恨交织的“AI科研”

在AI时代，大学教育究竟应该如何与AI共处？华中师范大学人工智能教育学部助理教授熊宇轩说：“我们平时教学和科研，也会碰到学生使用AI工具。我并不反对学生使用，甚至支持大家平日多用AI。但是在撰写论文的过程中，要合理与AI协作，批判性地使用AI，不可盲目照抄。”

但是究竟用到什么程度算合理呢？目前还没有一个统一的标准。

一位大模型算法工程师说：“AI检测判断一段文字带不带机器生成文本的统计特征。最常用的指标叫“困惑度“”（perplexity）：人写东西常有跳跃、犹豫和个人化表达，局部不太稳定；模型生成的文本则更均匀、更顺滑、更高概率。检测器据此训练分类模型，去学句长分布、词汇多样性、过渡词使用这些差异。一些系统还维护一套动态更新的‘AI 特征词库’，比如‘综上所述’‘不可否认’这类高频过渡短语一旦扎堆，疑似度评分就会明显往上走。”

这套逻辑只能判断“像不像”，没法证明“是不是”。

斯坦福大学 2023 年发表在 Patterns 期刊上的一项研究给出了迄今最有力的证据：研究团队用七款主流GPT检测器评估非英语母语者的写作，结果把超过一半的TOEFL作文误判成“AI 生成”，平均误报率达61.22%。

更极端的是，91篇TOEFL作文里有 18 篇被七款检测器一致判定为 AI 生成，89 篇至少被一款标记；而它们对美国本土八年级学生作文的判断却几乎不出错。研究者的解释是，被一致误判的那些作文困惑度明显偏低，检测器可能在惩罚语言表达受限的写作者。

图：同样是人类原创，非母语者的 TOEFL 作文被七款检测器误判为"AI 生成"的比例达 48%–76%，远高于美国本土学生作文的 0%–12%。来源：Liang et al., Patterns, 2023。

“目前的AI检测只是当下为了起到一定的监督作用，让学生不要照抄AI结果，做出的一种权宜之计。但是方法绝对不能称为完美。”一位头部高校的教授说。

这种“权宜之计”，正在给学生带来现实困惑。从多位本科、硕士毕业生和在读研究生的反馈看，AI已经深度进入论文写作、课程汇报和科研训练。他们普遍认为， AI不应该替代自己完成论文，但会在一些特定的环节使用 AI。

一位研究生毕业生说，自己会用AI“理一下思路”，把混沌的想法梳理成有逻辑的框架，也会让AI润色口语化表达，使其更符合学术规范。

另一位本科毕业生把AI形容为科研任务中的“执行端”：学生先厘清研究问题、给出明确指令，再对AI生成的代码或处理结果逐项审读、校验，最后决定下一步操作。在他看来，AI可以参与执行，但审查、判断和最终决策，仍必须由学生自己负责。

不过，学生对AI的依赖程度并不一致。也有人表示，自己很少使用 AI，因为研究方向较为垂直，AI 生成内容很鸡肋。他还提到，部分已发表文章中已经能明显看出AI生成痕迹，这让他重新思考学术写作中的风气问题。

但对于高校把“AI率”作为毕业论文管理门槛，毕业生的质疑主要集中在三点：检测工具本身不够稳定，可能误伤原创内容；检测规则容易被反向适应，催生“降AI率”的应对策略；单一以AI 率为评判方法的也无法区分“AI 辅助”和“AI 代写”，与真实科研中的人机协作方式脱节。

多名毕业生提到，自己或身边同学遇到过“明明是自己写的内容，却被检测系统标红 ”的情况。一些长难句、学术化表达、程式化结构，甚至学生自己反复修改后的文本，都可能被判定为较高 AI 率。

一位在读研究生说，她已经把文本改得更接近自己的语言习惯，AI率仍然有30%多，这让她觉得检测标准和机制存在“算法黑箱”。

学生们还担心，硬性卡AI率会把注意力从提升论文质量转向“如何通过检测”。一位毕业生说，身边有同学已经在总结AIGC检测规律，例如哪些词语、句式和结构更容易被标红，并据此形成“降AI率”的策略。结果可能是，真正由 AI 生成的文本通过改写逃过检测，而人工写作的文本反而被误判。

但是大部分人理解学校的初衷，对抗“AI代笔”，守住学术评价底线。但在他们看来，学术考核真正需要辨别的，更应当是学生有没有形成问题意识、独立判断和对成果负责的能力，而不是文本在多大程度上能通过逆向审查。

因此，多位受访者认为，AI的使用已经不可避免，关键不应是简单禁止，而是界定合理边界。

部分学校要求学生填写AI使用备案或说明，但这类制度在执行中也可能遇到尴尬。一位研究生毕业生说，学校要求说明是否使用 AI、具体在哪些环节使用，一旦这样要求，很多人就会倾向于填写“没有使用”。因为一旦承认使用 AI，反而可能引发更多怀疑。

基于此，一位高校研究生建议，学校可以要求学生披露 AI 使用范围，例如是否用于资料整理、语言润色、代码生成、数据处理或观点生成；另一方面，更应该通过开题、中期检查、答辩问询、原始材料、修改记录和研究过程说明，来看论文作者是否真正理解了自己的研究。

相比一个孤立的检测比例，这些过程性证据更能反映学生是否主导了论文工作。

时代的难题

通过独立思考产出原创性的研究成果，证明自己在某个专业领域具备了独当一面的能力。这是每个毕业生在走出校门之前的最后一道关卡。

因为AI的存在，证明“原创”这件事也变得更难了。天元律师事务所合伙人李昀锴律师说：“即使从法律概念看，目前更常使用的是“独创性”，而不是“原创性”。

独创性通常包括两层含义：一是作品由作者独立完成，不是剽窃、抄袭或复制他人作品；二是作品体现了作者本人的智力投入。

放到 AI 协作场景下，关键仍然是看人类作者在其中投入了多少实质性劳动。目前相关规定并不完全明确，更多还是要结合具体个案判断。如果作者先提出论文选题、搭建框架，再使用 AI 做资料整理、查询归纳或语言润色，论文主体仍由作者完成，通常更容易被认为具有人类智力投入。”

但是毕业生基数大，如果“含AI 率”普遍推行且太过于严格，即使检测工具出现 1%的误判率，影响的范围也不小。

“那些被AI毙掉的论文”，真的可能成为一个毕业生走出大学校门之前最大的忧伤和烦恼。

“因为目前缺乏法律规定，具体可能还要参考学校本身的论文指引和管理规范。”技术的进步已经跑到了制度制定之前。学校面临的“学术审查难题”，也许不应该仅仅由学校和学生来承担。

科幻作家阿瑟·克拉克有一条广为流传的“第三定律”：任何足够先进的技术，都与魔法无异。而创造魔法的人，也有责任制造有效的缰绳。

Google DeepMind的文本水印方案 SynthID-Text 已于 2024 年 10 月发表在 Nature 正刊（Vol 634，818–823 页），论文显示它只改动模型采样过程、不影响训练，检测时也不需调用原模型，已在 Gemini 上经近 2000 万次真实交互验证，用户几乎察觉不到质量差异，Google随后将它开源。

2026年5月，OpenAI也宣布在ChatGPT、Codex等工具生成的图片中嵌入SynthID 水印，并配合C2PA来源标准使用。

我们乐于看到的是，大模型公司已经在行动，为应对时代的难题，让魔法本身变得更可控更重要。

本文来自微信公众号“腾讯科技”，作者：晓静、谢瑞瑞，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。