棉花糖实验中等不及的孩子，其实更理性

开智学堂·2026年03月17日 08:34

等不及的孩子，不一定是失控的孩子。

你大概听说过：棉花糖实验被推翻了。2018 年，泰勒·沃茨用 900 多个孩子的数据证明，那个「等待两颗棉花糖的孩子长大后更成功」的结论，不太成立。但这只是故事的开头。在推翻之前，其实认知科学就给出了一个和「自控力」完全不同的解释。这篇文章就想搞清楚：我们对「延迟满足」这件事的理解，是否从一开始就跑偏了？

流浪汉收容所里的顿悟

2012 年，塞莱斯特·基德（Celeste Kidd）还是罗彻斯特大学脑与认知科学系的一名博士生。

某个下午，她在附近一家流浪汉收容所做志愿服务。她观察那里的孩子怎么玩耍、怎么争抢、怎么面对食物。

她注意到一件事：这些孩子面对零食，几乎从不等待。有人把糖果放在桌上，他们会立刻抓起来吃掉。不是慢慢品尝，而是以一种近乎焦虑的速度，迅速消化掉眼前的一切。

她的第一反应，是那个所有人都会有的判断：这些孩子自控力很差。

但第二个念头随即出现，让她坐在那里愣了很久：

这里的孩子，生活在一个物品随时会被偷走的环境里。大人的承诺，往往无法兑现。昨天还在的东西，今天可能就消失了。

在这样的世界里，立刻吃掉眼前的食物，难道不是最合理的选择吗？

回到实验室，基德决定验证这个直觉。她设计了一个简单但精妙的实验，那就是，在正式的棉花糖测试开始前，先给孩子一段「前置经历」：

不可靠组：研究者承诺会带来更好的美术材料，但两次都食言了。

可靠组：研究者每次都兑现承诺，带来了新蜡笔，带来了孩子喜欢的贴纸。

然后，再对两组孩子做经典的棉花糖测试。

结果如下：

同样的孩子，同样的棉花糖，同样的实验场景。唯一的差异，是他们对眼前这个研究者是否兑现承诺的经验。

基德把这篇论文命名为《理性零食》（Rational Snacking）。

标题本身就是一个立场声明：孩子吃不吃眼前的棉花糖，不是冲动失控的问题，而是理性推断的结果。

她写道：

一个习惯了物品被盗、承诺被打破的孩子，唯一有保障的奖励，是你已经吞下去的那块棉花糖。

换成认知科学的语言：孩子在做一道隐式的概率计算——等待这件事，有没有价值？这取决于他们对环境可靠性（environmental reliability）的历史经验，而不是某种固定的内在特质。

那个被判定为「自控力差」的孩子，其实是一个优秀的理性决策者。他只是生活在一个不值得等待的世界里。

米歇尔从没说过那句话

基德的发现和棉花糖实验的主导者沃尔特·米歇尔（Walter Mischel）最初的研究动机，其实很接近。

1960 年代，米歇尔在斯坦福大学一所幼儿园设计棉花糖实验时，他真正想搞清楚的问题不是「哪些孩子能忍住」，而是：孩子用了什么策略，让自己等下去的？

他观察那些成功等待的孩子，发现他们并不是靠硬撑。他们有一套主动部署的认知技巧：把棉花糖倒扣过来不看，把它想象成一朵云，或者唱歌、踢腿、捂住眼睛。他们用重新定义眼前事物的方式，压制住了立刻想吃的冲动。

孩子们在隐藏的摄像头下，可爱地挣扎着。

这套机制，他后来和心理学家珍妮特·梅特卡夫（Janet Metcalfe）一起，在 1999 年的《心理学评论》（Psychological Review）上发展成了正式的理论框架——热/冷系统（Hot/Cool System）：

冷系统（「know」 system）：认知性、策略性、缓慢的——这块棉花糖只是一朵云

热系统（「go」 system）：情绪性、冲动性、反射性的——我现在就想吃

论文援引了当时认知神经科学的研究数据：冷系统以海马体和前额叶皮层为神经基础，热系统则与杏仁核密切相关。这不是一个比喻，是一个有神经科学依据的理论框架，发表至今被引用超过 2700 次。

在米歇尔自己的框架里，延迟满足能力从来不是一种固定的人格特质，而是冷系统能否在特定情境下调动策略、压制热系统的动态结果。

但 1990 年追踪研究的数据一公开，媒体只看到了那条相关性：等待时间 → 学业成绩。

接下来的事，米歇尔大概始料未及。

米歇尔教授的论文在学界被引用了上千上万次；实验和研究结果纷纷被编入各种心理学的教材。

《纽约时报》、《纽约客》等主流媒体也曾纷纷发表相关文章讨论；以棉花糖实验写成的励志书籍轻轻松松就能荣登 Top 榜单，热销全球。

全球畅销书《Don’t eat the marshmallow… yet! for children》（中译本《孩子，先别急着吃棉花糖》）

TED 演讲把它讲成「一颗棉花糖预测孩子的未来」，育儿博主把它变成可操作的训练清单。一项关于认知策略机制的理论研究，在 20 年的大众传播中，被反复蒸馏成了一句关于天赋特质与命运的判决。

畅销书作者 Joachim de Posada 关于棉花糖实验的 TED 演讲

米歇尔晚年不止一次公开纠正这种误读。他在 2014 年出版的《棉花糖测试》（*The Marshmallow Test*）一书中明确写道，实验的真正价值在于揭示策略，而非预测人生。用这个测试给孩子贴标签，是对研究初衷的根本性误解。

没有人认真听他说话。

2018 年 5 月 25 日，泰勒·沃茨（Tyler W. Watts）的论文在《心理科学》（Psychological Science）发表，宣告这项几十年的经典实验被颠覆，学界震动。

2018 年 9 月 12 日，米歇尔在纽约家中去世，享年 88 岁。

他没有活着看到这场争议的终结。那篇「推翻」他研究的论文，核心发现是情境才是真正的预测变量，这与他本人一直强调的立场并不矛盾。孩子在什么样的情境里长大，决定了他们会使用怎样的策略。

沃茨推翻的，从来不是米歇尔的理论。

被推翻的，是几十年来大众对这项研究的误读。

贝叶斯视角下，棉花糖是一道概率题

基德的发现让人不安：如果等待与否是理性推断而非意志力，那孩子们到底在做什么计算？

《理性零食》这篇论文，本身就隐含着一套数学逻辑。

一个孩子面对棉花糖时，脑子里真正在运行的判断，大致是这样的：

P（大人说话算数）× 未来的奖励> 当下的奖励

其中，P（大人说话算数）是孩子基于过往经验估算的一个概率值。

它与贝叶斯推断的逻辑高度吻合：用历史证据更新信念，做出期望值最大化的选择。孩子不需要显式地做概率运算；他的直觉判断，已经在做同样的事。

收容所里的孩子，P 值接近于零。等一颗棉花糖？赔率太低了。

中产家庭的孩子，父母言而有信，P 值较高。等两颗棉花糖？合算。

当我们把这个框架放进来，米歇尔的热/冷系统模型就获得了一次升维。米歇尔说的没错——延迟满足需要冷系统接管热系统。但他和他的追随者漏掉了一个前提：冷系统在接管之前，首先要完成一次概率评估。

这个解读框架，与认知科学近年最有力的一个命题贝叶斯大脑（Bayesian Brain），在逻辑上高度契合。

神经科学家卡尔·弗里斯顿（Karl Friston）和其他研究者认为，大脑的基本工作方式不是被动接收信息，而是主动生成预测、不断用感官输入来更新内部模型。我们看到的世界，是大脑根据概率计算出来的最优解。

一个 4 岁的孩子当然不会做显式的贝叶斯运算，但他的神经系统在做同样的事情——只不过用的是隐性的、快速的、基于直觉的概率估计。

所以，等不等那颗棉花糖，从来都不只是「自控力」的问题。

它是一道概率题。

孩子在问的不是「我能忍住吗」，而是「值得等吗」。

这个认知翻转的意义，远超棉花糖实验本身。如果「自控力」这个标签本身是错的，那么几十年来建立在它之上的教育理念，例如延迟满足训练、意志力培养、抵制诱惑练习，是否也需要重新审视？

二十六岁时，预测效果几乎消失殆尽

如果说 2018 年的沃茨研究是第一击，2024 年的数据就是最后一锤。

杰西卡·斯珀伯（Jessica F. Sperber）带领团队，追踪了一批参与者从幼儿期到成年的完整人生数据。当他们分析 26 岁时的各项生活指标（学历、收入、心理健康、社会关系），再回头对照这些人 4 岁时在棉花糖任务中的表现，结果让人几乎无话可说：

错的不是孩子，是我们问的问题

六十年来，我们一直在问一个错误的问题。

我们问：孩子能不能忍住？

我们应该问：孩子为什么觉得值不值得等？

这背后是两套完全不同的观念。

第一套观念把孩子看作意志力的容器。容量大的孩子赢，容量小的孩子输，而容量是可以通过训练来扩充的。几十年的畅销书、正念课程、延迟满足训练，都建立在这套逻辑上。

第二套观念把孩子看作贝叶斯推断机。他们在用有限的信息，做出当下最理性的决策。等不等棉花糖，是环境可信度的函数，不是意志力的函数。

基德在收容所里看到的那一幕，是第二套观念最有力的注脚。那些长期生活在承诺被打破的环境里的孩子，发展出了一套完全理性的生存策略：及时拿走眼前的东西，因为等待在历史上从来没有兑现过。

这不是失控，这是适应。

所以，父母用棉花糖实验来焦虑孩子的「自控力」时，他们真正应该问的问题是：我是一个说话算数的父母吗？我为孩子创造的环境，是一个值得信任的环境吗？

如果答案是肯定的，那颗棉花糖自然会等到。

如果答案是否定的，再多的意志力训练，也只是在错误的层面用力。

棉花糖实验的崩塌，不是一个「科学被推翻」的故事，而是一个我们终于开始问对问题的故事。

等不及的孩子，不一定是失控的孩子。

他只是，比我们更早看清了那个房间里真实的概率。

参考文献：

1. Kidd, C., Palmeri, H., & Aslin, R. N. (2013). Rational snacking: Young children's decision-making on the marshmallow task is moderated by beliefs about environmental reliability. *Cognition, 126*(1), 109–114.

2. Metcalfe, J., & Mischel, W. (1999). A hot/cool-system analysis of delay of gratification: Dynamics of willpower. *Psychological Review, 106*(1), 3–19.

3. Mischel, W., Shoda, Y., & Rodriguez, M. L. (1989). Delay of gratification in children. *Science, 244*(4907), 933–938.

4. Watts, T. W., Duncan, G. J., & Quan, H. (2018). Revisiting the marshmallow test: A conceptual replication investigating links between early delay of gratification and later outcomes. *Psychological Science, 29*(7), 1159–1177.

5. Sperber, J. F., Vandell, D. L., Duncan, G. J., & Watts, T. W. (2024). Delay of gratification and adult outcomes: The Marshmallow Test does not reliably predict adult functioning. *Child Development, 95*, 2015–2029.

6. Friston, K. (2010). The free-energy principle: A unified brain theory? *Nature Reviews Neuroscience, 11*(2), 127–138.

本文来自微信公众号“开智学堂”（ID：openmindclub），作者：一休，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。