棉花糖实验中等不及的孩子,其实更理性

开智学堂·2026年03月17日 08:34
等不及的孩子,不一定是失控的孩子。

你大概听说过:棉花糖实验被推翻了。2018 年,泰勒·沃茨用 900 多个孩子的数据证明,那个「等待两颗棉花糖的孩子长大后更成功」的结论,不太成立。但这只是故事的开头。在推翻之前,其实认知科学就给出了一个和「自控力」完全不同的解释。这篇文章就想搞清楚:我们对「延迟满足」这件事的理解,是否从一开始就跑偏了?

流浪汉收容所里的顿悟

2012 年,塞莱斯特·基德(Celeste Kidd)还是罗彻斯特大学脑与认知科学系的一名博士生。

某个下午,她在附近一家流浪汉收容所做志愿服务。她观察那里的孩子怎么玩耍、怎么争抢、怎么面对食物。

她注意到一件事:这些孩子面对零食,几乎从不等待。有人把糖果放在桌上,他们会立刻抓起来吃掉。不是慢慢品尝,而是以一种近乎焦虑的速度,迅速消化掉眼前的一切。

她的第一反应,是那个所有人都会有的判断:这些孩子自控力很差。

但第二个念头随即出现,让她坐在那里愣了很久:

这里的孩子,生活在一个物品随时会被偷走的环境里。大人的承诺,往往无法兑现。昨天还在的东西,今天可能就消失了。

在这样的世界里,立刻吃掉眼前的食物,难道不是最合理的选择吗?

回到实验室,基德决定验证这个直觉。她设计了一个简单但精妙的实验,那就是,在正式的棉花糖测试开始前,先给孩子一段「前置经历」:

不可靠组:研究者承诺会带来更好的美术材料,但两次都食言了。

可靠组:研究者每次都兑现承诺,带来了新蜡笔,带来了孩子喜欢的贴纸。

然后,再对两组孩子做经典的棉花糖测试。

结果如下:

同样的孩子,同样的棉花糖,同样的实验场景。唯一的差异,是他们对眼前这个研究者是否兑现承诺的经验。

基德把这篇论文命名为《理性零食》(Rational Snacking)。

标题本身就是一个立场声明:孩子吃不吃眼前的棉花糖,不是冲动失控的问题,而是理性推断的结果。

她写道:

一个习惯了物品被盗、承诺被打破的孩子,唯一有保障的奖励,是你已经吞下去的那块棉花糖。

换成认知科学的语言:孩子在做一道隐式的概率计算——等待这件事,有没有价值?这取决于他们对环境可靠性(environmental reliability)的历史经验,而不是某种固定的内在特质。

那个被判定为「自控力差」的孩子,其实是一个优秀的理性决策者。他只是生活在一个不值得等待的世界里。

米歇尔从没说过那句话

基德的发现和棉花糖实验的主导者沃尔特·米歇尔(Walter Mischel)最初的研究动机,其实很接近。

1960 年代,米歇尔在斯坦福大学一所幼儿园设计棉花糖实验时,他真正想搞清楚的问题不是「哪些孩子能忍住」,而是:孩子用了什么策略,让自己等下去的?

他观察那些成功等待的孩子,发现他们并不是靠硬撑。他们有一套主动部署的认知技巧:把棉花糖倒扣过来不看,把它想象成一朵云,或者唱歌、踢腿、捂住眼睛。他们用重新定义眼前事物的方式,压制住了立刻想吃的冲动。

孩子们在隐藏的摄像头下,可爱地挣扎着。

这套机制,他后来和心理学家珍妮特·梅特卡夫(Janet Metcalfe)一起,在 1999 年的《心理学评论》(Psychological Review)上发展成了正式的理论框架——热/冷系统(Hot/Cool System):

冷系统(「know」 system):认知性、策略性、缓慢的——这块棉花糖只是一朵云

热系统(「go」 system):情绪性、冲动性、反射性的——我现在就想吃

论文援引了当时认知神经科学的研究数据:冷系统以海马体和前额叶皮层为神经基础,热系统则与杏仁核密切相关。这不是一个比喻,是一个有神经科学依据的理论框架,发表至今被引用超过 2700 次。

在米歇尔自己的框架里,延迟满足能力从来不是一种固定的人格特质,而是冷系统能否在特定情境下调动策略、压制热系统的动态结果。

但 1990 年追踪研究的数据一公开,媒体只看到了那条相关性:等待时间 → 学业成绩。

接下来的事,米歇尔大概始料未及。

米歇尔教授的论文在学界被引用了上千上万次;实验和研究结果纷纷被编入各种心理学的教材。

《纽约时报》、《纽约客》等主流媒体也曾纷纷发表相关文章讨论;以棉花糖实验写成的励志书籍轻轻松松就能荣登 Top 榜单,热销全球。

全球畅销书 《Don’t eat the marshmallow… yet! for children》(中译本《孩子,先别急着吃棉花糖》)

TED 演讲把它讲成「一颗棉花糖预测孩子的未来」,育儿博主把它变成可操作的训练清单。一项关于认知策略机制的理论研究,在 20 年的大众传播中,被反复蒸馏成了一句关于天赋特质与命运的判决。

畅销书作者 Joachim de Posada 关于棉花糖实验的 TED 演讲

米歇尔晚年不止一次公开纠正这种误读。他在 2014 年出版的《棉花糖测试》(*The Marshmallow Test*)一书中明确写道,实验的真正价值在于揭示策略,而非预测人生。用这个测试给孩子贴标签,是对研究初衷的根本性误解。

没有人认真听他说话。

2018 年 5 月 25 日,泰勒·沃茨(Tyler W. Watts)的论文在《心理科学》(Psychological Science)发表,宣告这项几十年的经典实验被颠覆,学界震动。

2018 年 9 月 12 日,米歇尔在纽约家中去世,享年 88 岁。

他没有活着看到这场争议的终结。那篇「推翻」他研究的论文,核心发现是情境才是真正的预测变量,这与他本人一直强调的立场并不矛盾。孩子在什么样的情境里长大,决定了他们会使用怎样的策略。

沃茨推翻的,从来不是米歇尔的理论。

被推翻的,是几十年来大众对这项研究的误读。

贝叶斯视角下,棉花糖是一道概率题

基德的发现让人不安:如果等待与否是理性推断而非意志力,那孩子们到底在做什么计算?

《理性零食》这篇论文,本身就隐含着一套数学逻辑。

一个孩子面对棉花糖时,脑子里真正在运行的判断,大致是这样的:

P(大人说话算数)× 未来的奖励> 当下的奖励

其中,P(大人说话算数)是孩子基于过往经验估算的一个概率值。

它与贝叶斯推断的逻辑高度吻合:用历史证据更新信念,做出期望值最大化的选择。孩子不需要显式地做概率运算;他的直觉判断,已经在做同样的事。

收容所里的孩子,P 值接近于零。等一颗棉花糖?赔率太低了。

中产家庭的孩子,父母言而有信,P 值较高。等两颗棉花糖?合算。

当我们把这个框架放进来,米歇尔的热/冷系统模型就获得了一次升维。米歇尔说的没错——延迟满足需要冷系统接管热系统。但他和他的追随者漏掉了一个前提:冷系统在接管之前,首先要完成一次概率评估。

这个解读框架,与认知科学近年最有力的一个命题贝叶斯大脑(Bayesian Brain),在逻辑上高度契合。

神经科学家卡尔·弗里斯顿(Karl Friston)和其他研究者认为,大脑的基本工作方式不是被动接收信息,而是主动生成预测、不断用感官输入来更新内部模型。我们看到的世界,是大脑根据概率计算出来的最优解。

一个 4 岁的孩子当然不会做显式的贝叶斯运算,但他的神经系统在做同样的事情——只不过用的是隐性的、快速的、基于直觉的概率估计。

所以,等不等那颗棉花糖,从来都不只是「自控力」的问题。

它是一道概率题。

孩子在问的不是「我能忍住吗」,而是「值得等吗」。

这个认知翻转的意义,远超棉花糖实验本身。如果「自控力」这个标签本身是错的,那么几十年来建立在它之上的教育理念,例如延迟满足训练、意志力培养、抵制诱惑练习,是否也需要重新审视?

二十六岁时,预测效果几乎消失殆尽

如果说 2018 年的沃茨研究是第一击,2024 年的数据就是最后一锤。

杰西卡·斯珀伯(Jessica F. Sperber)带领团队,追踪了一批参与者从幼儿期到成年的完整人生数据。当他们分析 26 岁时的各项生活指标(学历、收入、心理健康、社会关系),再回头对照这些人 4 岁时在棉花糖任务中的表现,结果让人几乎无话可说:

相关性接近于零。

不是变弱了,不是被其他变量稀释了。是几乎不存在。

斯珀伯在论文中写道,在控制了家庭社会经济地位和认知能力之后,棉花糖任务的结果对成年期结果几乎没有独立的预测贡献。

这意味着:那些当年等到两颗棉花糖的孩子,之所以后来「更成功」,很可能不是因为他们更能忍,而是因为他们生活在一个更稳定、更可预期的环境里——那个环境,教会了他们「等待是值得的」。真正的预测变量,是环境的可靠性,而非孩子天生的意志力。

棉花糖,从来都只是一面镜子。镜子里映出的,是孩子背后的世界,不是孩子本身的意志。

错的不是孩子,是我们问的问题

六十年来,我们一直在问一个错误的问题。

我们问:孩子能不能忍住?

我们应该问:孩子为什么觉得值不值得等?

这背后是两套完全不同的观念。

第一套观念把孩子看作意志力的容器。容量大的孩子赢,容量小的孩子输,而容量是可以通过训练来扩充的。几十年的畅销书、正念课程、延迟满足训练,都建立在这套逻辑上。

第二套观念把孩子看作贝叶斯推断机。他们在用有限的信息,做出当下最理性的决策。等不等棉花糖,是环境可信度的函数,不是意志力的函数。

基德在收容所里看到的那一幕,是第二套观念最有力的注脚。那些长期生活在承诺被打破的环境里的孩子,发展出了一套完全理性的生存策略:及时拿走眼前的东西,因为等待在历史上从来没有兑现过。

这不是失控,这是适应。

所以,父母用棉花糖实验来焦虑孩子的「自控力」时,他们真正应该问的问题是:我是一个说话算数的父母吗?我为孩子创造的环境,是一个值得信任的环境吗?

如果答案是肯定的,那颗棉花糖自然会等到。

如果答案是否定的,再多的意志力训练,也只是在错误的层面用力。

棉花糖实验的崩塌,不是一个「科学被推翻」的故事,而是一个我们终于开始问对问题的故事。

等不及的孩子,不一定是失控的孩子。

他只是,比我们更早看清了那个房间里真实的概率。

参考文献:

1. Kidd, C., Palmeri, H., & Aslin, R. N. (2013). Rational snacking: Young children's decision-making on the marshmallow task is moderated by beliefs about environmental reliability. *Cognition, 126*(1), 109–114.

2. Metcalfe, J., & Mischel, W. (1999). A hot/cool-system analysis of delay of gratification: Dynamics of willpower. *Psychological Review, 106*(1), 3–19.

3. Mischel, W., Shoda, Y., & Rodriguez, M. L. (1989). Delay of gratification in children. *Science, 244*(4907), 933–938.

4. Watts, T. W., Duncan, G. J., & Quan, H. (2018). Revisiting the marshmallow test: A conceptual replication investigating links between early delay of gratification and later outcomes. *Psychological Science, 29*(7), 1159–1177.

5. Sperber, J. F., Vandell, D. L., Duncan, G. J., & Watts, T. W. (2024). Delay of gratification and adult outcomes: The Marshmallow Test does not reliably predict adult functioning. *Child Development, 95*, 2015–2029.

6. Friston, K. (2010). The free-energy principle: A unified brain theory? *Nature Reviews Neuroscience, 11*(2), 127–138.

本文来自微信公众号“开智学堂”(ID:openmindclub),作者:一休,36氪经授权发布。

+1
3

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

警惕医疗AI「数据污染」自我训练造成诊断可靠性的持续下降

2小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业