用AI检测AIGC率,靠谱吗?

霞光AI实验室·2026年07月01日 19:00
AI检测悖论仍存,却因刚需成为AI世界必要边界

6月23日,Superhuman宣布收购AI检测工具GPTZero。

这件事有意思在哪呢?

收购方Superhuman是Grammarly的母公司,而Grammarly,是全球最大的AI写作辅助工具之一,每天帮助4000万人把文章写得更通顺、更流畅。

而被收购方GPTZero,是一款拥有1900万用户的AI检测工具,专门去判断一篇文章到底是不是AI写的。

也就是说,Superhuman一边用Grammarly去鼓励AI写作,一边又用GPTZero检测是否是AI写作,来“反”AI写作,这难道不是典型的左右脑互博吗?

AI检测AI:一个无法自洽的“伪命题”

用AI去检测AI,这套逻辑从一开始就很拧巴。

无论是AI生成还是AI检测,二者都是基于海量人类文本训练出来的模型,用的也是同一类技术路线:检测工具手里的那套人类写作标准,生成工具那里也有一套。而AI写作本来就是模仿人类写作,现在又要用AI检测工具去判断AI写的像不像人、人写的像不像AI,本身就是一个悖论。

而且,这里面存在着一个很致命的结构性问题:AI检测可能永远跑不赢AI生成

检测工具想要识别一款新模型的输出,需要拿到足够多的样本、标注数据、然后训练分类器。这个过程快则两三个月,慢则更久,但模型迭代的速度不会等人。例如,GPT-4在2023年3月发布,同年11月GPT-4 Turbo亮相,间隔八个月。在这八个月里,Anthropic发布了Claude 2,Meta推出了Llama 2,各家模型接连更新,输出特征各不相同。等到检测工具终于完成训练、准备部署,新一代更强大的模型已经发布了。用上一代的数据去判断新一代的输出,准确率自然也会打折扣。 这种节奏问题,会让AI检测陷入“它跑它追,却无法追得上”的持续困境中。

此外,这套逻辑中还有一个绕不开的问题:AI幻觉。

AI写作会时不时产生幻觉,编造一些错误的或完全不存在的信息;而在检测AI过程中同样也会产生幻觉,形成误判,把人类写作标记为AI生成,或者把AI生成标记为人类写作。让一个会犯错的东西去审判另一个会犯错的东西,最终的后果却要人来承担,这也是AI检测AI的矛盾根源所在。

现实情况也印证了这一点,而且比想象的更加离谱。

有网友曾将1776年托马斯·杰斐逊写的《独立宣言》放入AI检测工具中,结果被系统判定为“99.99%为AI生成”。一份写于AI诞生前两百多年的历史文献,在算法眼里就这样变成了机器产物。还有荣誉退休教授保罗·斯皮克四十五年前写的一篇论文,被某检测工具判定有77%的内容是AI生成的。

这些作品诞生的时候,甚至大语言模型连概念都不存在。

怎么会如此离谱?

事实上,AI检测器并不是理解文本的含义,它们关注的是文本的统计特征:词语序列的意外程度、句式长短和结构的变化幅度、词语搭配是否符合常见模式。越是用词精准、逻辑严密、句式规范的文字,越容易被判为AI写的;相反,语序混乱、用词生硬的内容,反倒更容易通过检测。

当写得足够好反而成了被AI怀疑的理由,这已经不单单是技术缺陷的问题,而是这套逻辑本身就需要被重新审视。

如何向AI证明“人类创作”

除了AI检测工具自身的逻辑悖论,在全民拥抱AI的时代,用AI创作内容已被大多数人默认许可,现在又要用AI去检测内容中AI的比例,这便构成了另一层发展悖论。

不过,悖论归悖论,要问AI检测工具是否有现实需求,答案无疑是肯定的。

ChatGPT发布之后,学生的课堂作业、毕业论文都开始受到AI的冲击,老师需要判断学生作业是否由AI代写,是否存在学术不端等问题。

GPTZero就是在这种情况下诞生的。2023年初,受ChatGPT影响,学术造假情况逐渐增多,美国纽约市教育部甚至直接宣布禁用ChatGPT以保护学术诚信。发现这个教育痛点后,当时还在普林斯顿读大四的爱德华·田花几天时间写出了GPTZero原型,并将其发布至推特。他本以为只有几十个人会试,结果几小时内涌进两千多人,托管平台直接崩溃。三年后的今天,这个项目做到了3000万美元年收入

市场的需求,远比想象中更真实。

但现实却在AI的演进中走向了另一个方向。

理想的场景是:学生认真写完论文,AI检测确认是“人写的”,然后提交给老师。

现实的场景却是:学生写完论文,先过一遍AI检测——AI率太高——把论文故意改差——再过一遍检测——AI率降了——提交。

论文写作不再是思考和表达,而是变成了一场与算法的猫鼠游戏。

“真的被AI检测气笑了。”小红书上,一名今年写毕业论文的学生表示,快毕业那段时间,自己每天都陷入向AI证明自己的论文是人创作而不是AI的循环中。

3月-5月,临近毕业这段时间,网上也陆续冒出了大量“降AI率教程”,逻辑和“降重”类似。有人建议,把AI生成的文本故意改得不通顺;有人建议批量删掉“首先”“综上所述”等开头的短句,因为这些结构容易被算法标记;还有人建议用翻译软件来回转换,输出的文本虽然可能不太流畅,但AI率能降下来。

3月-5月,小红书上出现大量论文AI检测、降AI率的帖子

有学生无奈地感慨:“感觉改完之后,能过得了AI检测,但过不了导师那一关。”

事实上,当学生把大量时间花在“降AI率”上,论文的写作价值就已经被掏空了。写作能力养成的核心环节,从反复打磨、锤炼表达,变成了摸索算法偏好、制造人工痕迹

不仅如此,就连那些没有使用过AI的学生,也未能在这场猫鼠游戏中全身而退。

加州大学戴维斯分校的学生威廉·夸特曼就曾遇到过类似的“AI检测乌龙”事件。2023年,夸特曼在一次历史考试中被教授怀疑用ChatGPT作弊,其论文也被GPTZero检测为“很可能由AI生成”。教授据也因此给了他不及格,并将其移交至学校的学术诚信调查部门。为了自证清白,夸特曼向校方提供了Google Docs的编辑历史,包括文档的逐字修改记录、打字的时间线等操作痕迹,这才被学校撤销了指控。

一旦AI检测失误,将没有用AI的内容标记成AI,人们就要陷入无休止的自证。AI本应服务于人,现在却反过来要求人向技术证明自己的可信度。

矛盾中的市场刚需

AI发展到现阶段,一个不得不承认的事实是,尽管AI检测赛道充满着矛盾和悖论,但相关产品不仅不会消失,还会越来越多,市场也将会持续扩张。

2026年1月,《2026 AI Detection Landscape Report》给出了一组数字:全球AI内容检测平台从2024年的约85个增长到2026年的247个,两年增长了190%,文本检测的平均准确率也从90.1%爬升到了94.3%

这些AI检测工具也不再只是老师抓作弊的帮手,而是不断进化,进入到了更多原本意想不到的地方。

2026年1月,Originality.ai发布了专为STEM学科设计的Academic Model,用于检测包含代码和公式的学术作业。6月,公司又发布了Moodle插件,让教育机构能将其AI检测和查重功能无缝集成到教学管理系统中。

此前专注于文本检测和查重的Copyleaks,也在今年6月份也进入了AI检测赛道,推出了一款企业级AI视频检测工具,能够对视频文件的视觉和音频轨道进行同时扫描,精准识别AI生成内容出现的具体时刻。

教育场景只是起点,但远不是终点。这些产品迭代的背后,还有一道更深的推力在发挥作用——AI合规

随着AI生成内容越来越逼真,效率提升的另一面,是风险的同步增长。近两年,利用AI换脸和语音克隆实施的诈骗案件明显增多,福建一位企业负责人被伪造的“好友”视频骗走430万元,全国政协委员靳东在今年两会期间也披露,有老人因AI伪造的人脸和声音被骗走27万元养老钱。

诈骗的蔓延加速了监管落地。2025年3月,《人工智能生成合成内容标识办法》发布,要求所有AI生成的文本、图片、音频、视频添加显式和隐式标识。2026年6月,短视频平台全面上线AI生成内容标注标签,未标注的内容不予分发。国际市场上,美国联邦贸易委员会目前已依据《TAKE IT DOWN Act》对AI深度伪造内容进行执法,欧盟《人工智能法案》第50条关于AI标识的透明度义务也将于2026年8月2日生效。

而这还仅仅只是开始,未来的合规监管一定会更具体、更严格——哪些场景必须标注、哪些场景禁止使用AI生成、平台承担多大的审核责任,都将会有更明确的规定。当这些规定逐步落地,AI检测就不再只是学校的工具,而是内容平台、媒体机构、广告公司、金融机构等各行各业都离不开的基础设施。银行需要确认客服电话那头是真人还是克隆语音,新闻媒体需要核实一段现场视频有没有被AI篡改,招聘平台需要验证求职者的视频介绍是不是本人拍摄的。

一边鼓励用AI提效,一边检查哪些东西用了AI。AI检测这件事,看似和拥抱AI的大趋势背道而驰,但实际上并非是传统意义上的倒退。当一个技术能以假乱真的时候,区分真假就是对更多人负责。学生可以用AI辅助学习,但论文需要证明是自己写的,这关乎教育公平。企业可以用AI生成营销素材,但产品宣传视频不能靠捏造不存在的功能欺骗消费者。普通人刷短视频时,更有权知道屏幕里的内容是否是真实存在的。

AI生成的内容越多,真假就越难分辨,AI检测工具的角色也就越清晰:它不是在限制AI发展,而是在为这个快速膨胀的世界标出必要的边界。边界之内,AI可以自由生长;边界之外,有些东西必须属于人类。看似矛盾,实则是技术演进到一定阶段必然会出现的制衡。

这个世界已经离不开AI,也更离不开能分辨AI的人。这也是为什么一个充满矛盾的赛道,会越走越宽。

本文来自微信公众号“霞光AI实验室”,作者:霞光AI实验室,36氪经授权发布。

+1
7

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
特邀作者

陪跑AI创业者,服务AI创业全球化

下一篇

当家电巨头在欧美高举高打,全力冲击高端市场时,国产小家电正在东南亚掀起一场“侧翼战”。

1小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业