新型「验证码」诞生?这张图让 ChatGPT、Claude、Gemini 都翻了车
人眼秒懂,AI抓瞎!网友用光学错觉玩坏大模型,全网百万人围观。
又多了一个能捉弄大模型的小测试。
表面看这是一张平平无奇、由一堆网格组成的静态图案,但如果我们稍微退后一点,或者眯缝一下眼睛,就会注意到图片中心隐约浮现出一个心形,甚至当我们向上滚动屏幕时,这个心形还能左右移动。
这是一种典型的基于网格的光学错觉,类似于赫尔曼网格错觉(Hermann Grid)。在这些错觉中,网格的交叉点似乎会浮现出暗色斑点或形状,尽管这些斑点实际上并不存在。这种现象源于人类视觉系统中的侧抑制机制,即视网膜中一个神经元的活动会抑制其邻近神经元的活动,从而增强对比度,有时会在边缘或交叉点产生虚幻的感知。
X 博主 @JonhernandezIA 认为这种光学错觉可以成为一个「AI 检测器」,因为人类大脑的生物特性(容易受到错觉影响)与 AI 的计算特性(依赖数据和算法)存在显著差异。
短短时间内,该帖子获得近 50 万浏览量,引发大量回复,不少网友测试了不同 AI 的反应,有些 AI 频频翻车,有些则能在提示后识别出心形。
比如网友 @swombat 分别用 GPT-5 Pro、GPT-5 和 Claude Opus4.1 测了一圈,三款大模型没一个答对的。
GPT-5 Pro 思考了 10 多分钟,认为图中隐藏的图案是个倾斜的方形(菱形);GPT-5 更离谱,瞎话张嘴就来,说是一只熊猫;Opus4.1 直接摊牌,「我实际上并没有发现隐藏的图像」。
网友 @lingzhong_eth 还测试了谷歌 Gemini,甚至问的非常直白「你在这张图片中看到心形了吗?」,谷歌 Gemini 很干脆地回复「没有」。
即使有提示词,Grok 要么识别不出:
要么信口胡编,说隐藏在网格中的是单词「JESUS」:
当然也有成功的 case。
网友 @EdDiberd 在稍晚时间使用 GPT-5 Pro,没有依赖模型的定制功能或者记忆功能,直接上传图片并输入提示词:Find the hidden shape,这次 GPT-5 Pro 给出了正确答案。
有人质疑 GPT-5 Pro 之所以能答对,是因为使用了网络搜索,于是该网友放出了录屏视频。
他甚至还找了一些熊猫的图片试了下,GPT-5 Pro 在思考了近 4 分钟后答对了。(我似乎有点懂了前文中为啥给一张心形的图案,GPT-5 却回答是一只熊猫了。)
网友 Moll 也表示,一开始 ChatGPT 和 Claude 都只看到了「这只是视觉错觉」,直到她要求这俩模型看完整个图片后,他们才回答出「心形」。
还有网友表示,提示词中可以先让 ChatGPT 模糊图像,这就像眯眼,然后再让它认真思考,就能得到正确答案。
不过也有网友质疑这种光学错觉作为 AI 测试的有效性。
「这并不是一个真正意义上的测试或基准,也不是 AI 研究社区长期努力追求的目标。这只是某个 Twitter 上的随机用户几分钟前突发奇想,认为这可以成为一个捉弄聊天机器人的好方法。」
One more thing
除了上述浮动的心、隐藏的熊猫外,还有不少好玩的小测试。
比如这则视频中晃动着 tldraw 这几个字母,如果我们按下暂停键,这几个字母就神奇般消失了。
还有下面这则左右移动的宝剑的视频,也是一暂停就消失。
网友 @tldraw 拿它考验了一下 Gemini,Gemini 似乎翻车了。
有网友评论称,通过运动消除噪音,适用于多种场景。
还有网友表示,这会是检测机器人的新型验证码吗?
参考链接:
https://x.com/JonhernandezIA/status/1982216149124153795
https://x.com/bpiatt/status/1981906578795094071
https://x.com/EdDiberd/status/1982286711007609229
https://x.com/Rainmaker1973/status/1982400788782838182
https://x.com/tldraw/status/1982435625480433892
本文来自微信公众号 “机器之心”(ID:almosthuman2014),编辑:杨文,36氪经授权发布。















