如何像贝叶斯主义者一样思考
神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
编者按:在这个几乎没有“绝对”的世界里,能够清晰地思考概率问题是非常重要的。本文来自编译,希望对你有所启发。
图片来源:Cheryl Chan/Getty
本文原作者迈克尔-G-泰特鲍姆(Michael G Titelbaum)是威斯康星大学麦迪逊分校维拉斯杰出成就哲学教授,著有《放弃确定性》(2013 年)和《贝叶斯认识论基础》(第一卷和第二卷)(2022 年)。
一、生活并非“非此即彼”,而是概率问题。
经常有人问你相信什么。你相信命运吗?你相信全球变暖吗?你相信婚姻吗?你经常被告知,你的信念对你是谁、你应该做什么至关重要:“做你认为对的事。”
这些信念问题要求我们给出非此即彼的答案。但生活中的很多事情都比这复杂。你可能不信神,但也可能不愿意排除神的存在。
对于许多重要问题,即便有三个选项也是不够的。现在,我正试图为孩子们确定我的家庭能够负担得起的大学。我孩子的选择将取决于很多变数:他们能进入什么样的学校?什么样的学校适合他们?如果我们以各种方式投资,那么在未来的两年、五年或十年里,会获得什么样的回报?
假设有人想帮我解决这个问题,他说:“这其实很简单。告诉我,你是相信你的大女儿能进当地的公立学校,还是不相信她能进?”我不知道该怎么回答这个问题。我不相信她能进那所学校,但我也不相信她进不了。她能考上的把握也许比50%要要大一些,但也远远谈不上确定。
我过去几十年最重要的概念发展之一,就是认识到信念是有程度之分的。我们不只是相信或不相信某件事情,我们的大部分思考和决策都是由不同程度的信心驱动的。这些信心水平可以用概率来衡量,从 0% 到 100% 不等。当我把为子女教育存下的钱用于投资时,如果只关注“我是否相信未来10年股票的表现会优于债券”这个问题,那就过于简单化了。我不可能知道答案,但我可以尝试对每种可能的结果进行有根据的概率估计,并根据这些估计来平衡我的投资组合。
通过多年的研究,我们知道用概率进行推理是很困难的。大多数人从小到大都是在“全有或全无”的条件下进行推理的。我们很有能力表达对事件的中等程度的信心,但非常不擅长对这些概率进行推理。研究一再表明,普通人的概率思维存在系统性错误。
幸运的是,曾经有一个叫托马斯-贝叶斯(Thomas Bayes)的人。他在 18 世纪对概率数学的研究激发了一场运动,我们现在称之为贝叶斯统计运动。你可能在谈话中听到过“贝叶斯”的说法,或者在新闻报道中听到过。贝叶斯主义的核心是一种概率推理工具包,它告诉你如何用数字衡量置信度,如何测试这些置信度是否合理,以及随着时间的推移如何管理这些置信度。
最后一部分很重要,因为对于任何给定的说法,你在某些时候都可能比在其他时候更有信心。一旦我的大女儿参加了一系列标准化测试,我就会对她的大学前景有新的证据,并相应地调整我的信心水平。贝叶斯主义提供了这样做的一种方法。
在本指南中,我将提供五个基本的贝叶斯思想,来帮助你提高概率推理能力。这些只是一个开始,如果你真的想深入研究细节和数学,那么我会在最后提供一些链接和书籍。我不能保证能让你成为一个完美的概率推理者,但希望本篇文章能给你提供一个起点,帮助你更好地根据证据梳理观点,并在面对不确定性时做出更好的决策。
二、深思熟虑。
2.1 拥抱边缘
贝叶斯主义的第一步是停止以全有或全无的方式思考。贝叶斯学派想要超越“要么相信,要么不信”的二分法,并把信念看作是有程度的东西。这些程度可以从 0% 到 100% 来衡量。如果你确信某件事情会发生,那就是 100% 的信心。如果你确信它不会发生,那就是 0%。
但是,贝叶斯学派建议不要走极端。在极少数情况下,确定某事会发生或不会发生都是有意义的。贝叶斯学家丹尼斯-林德利(Dennis Lindley)在他的《决策》(Making Decisions,1971 年)一书中赞许地引用了奥利弗-克伦威尔(Oliver Cromwell)的箴言:“要始终认为自己有可能犯错。除非某个事件绝对不可能发生,否则你就不应该确定它不会发生。”
那好吧,也许我们不应该给任何严格意义上可能发生的事情赋值置信度为0,但我们都听过有人把这种可能性描述为“百万分之一”。如果某件事情真的那么不可能发生,那它就很可能不会发生,对吧?那么,百万分之一还不如零呢?同样是丹尼斯-林德利,他也说他可以把月球是由绿色奶酪构成的可能性定为百万分之一。
在进行概率推理时,一个常见的错误是认为一个百分点的一小部分(尤其是接近0%或100%这样的极端值)真的无关紧要。任何有幸获得高质量现代产前保健服务的父母,都会看到基因检测报告,显示其成长中的胎儿患某种疾病和先天缺陷的可能性有多大。我记得和怀孕的妻子一起看过 0.0004% 和 0.019% 这样的概率,并想知道我们应该担心什么,什么可以忽略不计。这种微小的概率差异很难直观地把握。但是,概率为 0.019% 的情况发生的可能性几乎是概率为 0.0004% 的情况发生的可能性的 50 倍。
看到 0.0001% 这样的概率值(百万分之一),人们很容易认为这与 0% 之间的差异不过是四舍五入的误差。但是,概率为 0% 的事件根本不可能发生,而概率为 0.0001% 的事件却经常发生。如果你有几分钟时间和一些零钱,可以去掷 20 次硬币。无论你最终观察到的是哪种正面和反面的序列,这种特定序列发生的几率都小于百万分之一。
为了更好地评估“几乎不可能”和“几乎确定”的重要性,贝叶斯学派有时会从以百分比衡量概率转变为以赔率衡量概率。如果我给你买了足够多的彩票,让你有 0.001% 的机会中奖,又给你的朋友买了足够多的彩票,让他有 0.1% 的机会中奖,你可能会非常生气。把这些数值换成赔率形式,我们可以看到,我给了你朋友千分之一的机会,而你只有十万分之一。用赔率的形式来表示概率,就可以清楚地看出,你的朋友有 100 张彩票,而你只有 1 张,这就说明这两个概率(虽然都接近零)还是有很大的不同。
2.2 证据支持使之成为可能的东西
贝叶斯到底做了什么,让整个统计运动以他的名字命名?在贝叶斯之前,许多概率论都涉及“直接推论”问题。这就是你在学校里多次被要求解决的概率问题。题目说小明同时掷出了两颗六面骰子,并要求你计算两颗骰子的和为 8 的概率。说得更抽象一点,给你一个关于世界上某个概率过程的假设,并要求你计算它产生某种特定证据的概率。
贝叶斯感兴趣的是相反的情况,也就是所谓的“逆推理”,假设你观察到一些证据,并想推断出世界上可能产生该证据的过程的假设。汉斯-赖兴巴赫(Hans Reichenbach)在《概率论》(The Theory of Probability,1935 年)一书中列举了许多我们使用这种结构进行推理的场合:
医生从观察到的症状推断出特定疾病的诊断,就是这种类型的推理;历史学家确定历史事件的推理也是这种类型的推理;同样,侦探从不起眼的可观察到的数据推断出犯罪行为,也是这种类型的推理。
贝叶斯对逆推理最重要的贡献在他生前并未得到认可。1761 年,贝叶斯去世后,一位名叫理查德-普赖斯的威尔士牧师发表了他在贝叶斯笔记中发现的一个定理。后来,皮埃尔-西蒙-拉普拉斯(Pierre-Simon Laplace)独立地重新发现了这个定理,并在很大程度上推动了它的早期普及。
普赖斯、拉普拉斯等人将贝叶斯定理作为发现新证据后调整假设可信度的规则,并加以推广。现代贝叶斯学派之所以被称为贝叶斯学派,是因为他们坚持贝叶斯法则。根据贝叶斯法则,你对假设的最新置信度应由两个因素计算得出:你在获得证据之前的信心程度,以及证据对假设的支持力度。
这里我们要记住贝叶斯学派对绝对的厌恶。虽然当一个角色了解到一条信息,从而改变了他们的整个世界观时,会产生很好的戏剧效果,但生活中的大多数情况并非如此。我们获得的每一条新信息都只会改变我们的部分观点,而且是逐步改变,让我们对特定事件的发生略微更有信心或更没信心。这是因为证据支持也有程度之分的,一个证据对某些假设的支持可能较弱,对另一些假设的支持可能较强;或者一个证据对某个假设的支持可能强于另一个证据。
要衡量证据对某个假设的支持力度,可以问一下该假设对证据的支持可能性有多大。假设有一天晚上你下班回家很晚,走进家门发现家里所有的灯都亮着。你想知道还有谁在家,丈夫?还是儿子?你的丈夫总是抱怨电费太贵,在家里走来走去,不停地关灯。而你十几岁的儿子却几乎不注意周围的环境,离开房间时也不知道自己是怎么离开的。如果你儿子在家里,你发现的证据就很有可能成立,而如果你丈夫在家,可能性就小得多。因此,证据强烈支持你儿子在家,而你丈夫在家的可能性很小或根本没有。
贝叶斯法则指出,一旦你评估了新证据对各种假设的支持程度,就应该将信心转向支持程度更高的假设。无论你在进门前对丈夫或儿子在家有多大信心,你在门内的发现都会增加你对儿子在家的信心,而降低你对丈夫在家的信心。增加和减少多少才是合理的呢?这一切都要通过贝叶斯法则的具体数学来解决。我在这里尽量简明扼要,避免使用方程式,但最后一节中的资料可以补充细节。
2.3 关注所有证据
贝叶斯思维的一个一贯主题是,与绝对思维相比,置信度的大小会变得更加复杂和微妙。确凿的证据有一个很好的特点,那就是它不会被任何事物所推翻。如果一位数学家证明了某个定理,那么之后所学到的任何东西都无法推翻这个证明,也无法让我们有理由不相信它的结论。
贝叶斯主义旨在理解增量证据,以应对我们每天面对的各种不那么确凿的信息。这类证据的一个重要特征是,它总是可以被推翻。这正是曲折推理小说的命脉所在:目击者说凶手左手持枪,但事实证明她当时是通过镜子发现的,而验尸结果又显示受害者在中枪前已被毒死……
因为证据的重要性在很大程度上取决于背景,而且潜在的失败可能一直潜伏着,所以重要的是不要自满于自己所知道的,要对相关的新信息保持开放的心态。但同样重要的是,要对已有的信息进行全面而仔细的思考。鲁道夫-卡尔纳普(Rudolf Carnap)提出了“全面证据原则”(Principle of Total Evidence),要求你对某个问题的信念必须包含并反映你所掌握的与该问题相关的所有证据。
这里有一种我们经常忽略的相关证据:除了拥有关于某个话题的信息之外,我们通常还知道自己是如何获得这些信息的。现在,这并不总是正确的:我知道亚伯拉罕-林肯出生在一个小木屋里,但我不知道我是从哪里得知这个小道消息的。但通常情况下,尤其是在当今不确定的媒体环境中,跟踪自己的信息来源,并评估你所获得的信息是否是以一种有偏见的方式呈现的,是很有必要的。
阿瑟-爱丁顿(Arthur Eddington)爵士举过这样一个例子:从湖里捞出一大群鱼,所有的鱼都长过六英寸。通常情况下,这将有力地证明湖里的所有鱼至少都有这么长。但是,如果你知道是用一个有六英寸孔的网捕到这些鱼的,那么你就不能从样本中得出原本合理的结论。
关注证据的选择方式会对现实生活产生重要影响。在《如何不犯错》(How Not to Be Wrong, 2014)一书中,乔丹·艾伦伯格(Jordan Ellenberg)讲述了一个发生在第二次世界大战中的故事:美国军方向统计学家亚伯拉罕·沃尔德(Abraham Wald)展示了一组数据,数据表明,从空战中返回的飞机机身上的弹孔比发动机上的弹孔更多。军方正在考虑将装甲从发动机转移到机身,以更好地保护飞行员。沃尔德的建议正好相反,理由是返航的飞机机身上有洞,而那些没有回来的是引擎上有洞,所以额外的装甲应该放引擎所在之处。
2.4 不要忘记你之前的观点
你要仔细思考收到的新证据,要仔细考虑所有因素,考虑背景,并记住证据的来源。考虑到这一切,你就会找到使证据最有可能成立的假设,也就是证据最有力支持的假设。这就是你现应该最相信的假设,对吧?
错了。贝叶斯法则指出,要对新证据做出反应,就要增加对使该证据最有可能成立的假设的信心。但增加信心后的结果如何,取决于你在证据出现之前的信心状况。
举个推理冠军朱莉娅-加尔夫(Julia Galef)的例子,假设你正在穿过大学校园,随机拦下一个大学生问路。这位大学生的眼神迷离而悠远,穿着像睡衣一样的衣服,而且似乎对自己在这个时候还醒着感到有些惊讶。你是更应该相信你的对话者是哲学系还是商学系的学生呢?
答案很简单:这种表情更像是哲学专业的学生,而不是商务专业的学生,所以你应该更确信你面对的是哲学专业的人。乍一看,这个答案似乎得到了我所描述的贝叶斯思维的支持。举几个数字,我们假设三分之一的哲学专业学生符合这一描述,但只有二十分之一的商业专业学生符合这一描述(也许是量化分析师?)假设你随机拦住问路的人是学哲学的,你的证据的概率是三分之一。如果假设你拦下的是一个商科专业的学生,那么概率是二十分之一。因此,你从这个学生的外表得到的证据更有力地支持了他们是学哲学的这一观点。
但现在请考虑以下情况:在我所在的校园里,哲学专业的本科生目前还不到 250 人,而商科专业的本科生大约有 3,600 人。如果上一段中的分数是正确的,那么我们应该预计校园里大约有 80 名哲学系学生与周围环境脱节,大约有 180 名商科专业学生与周围环境脱节。因此,如果你随机选择一个本科生,那么商科专业学生的可能性至少是哲学专业学生的两倍。
这里的关键是要记住,在你对这个学生的外表进行评估之前,他们学商科的几率要比学哲学的大得多。你从与他们的互动中获得的证据,应该会增加你对他们是哲学家的信心,但增加之后的数字依旧很小。
贝叶斯法则要求你在了解一些证据后,对一个假设的最新信心要结合两个因素:你之前对假设的信心,以及新证据对假设的支持力度。忘记前者,只关注后者,这就是所谓的“基率谬误”。不幸的是,这种谬误经常出现在专业人士身上,甚至是那些处理影响生命的数据的人。
假设有一种罕见病,每 1000 人中只有一人患有这种疾病,现在针对这种罕见疾病开发出了一种新的医学检测方法。检测结果相当准确:患有这种疾病的人在 90% 的情况下检测结果呈阳性,而没有这种疾病的人在 10% 的情况下检测结果呈阳性。
你随机抽取一个人,进行检测,结果呈阳性。你有多大把握认为他们感染了这种疾病?
大多数人,包括训练有素的医学专家都会说,应该有 80% 或 90% 的把握认为患者患病。根据贝叶斯法则,正确答案是低于 1%。问题是,大多数受访者都被测试的准确性所压倒,以至于忽视了这种疾病在人群中的罕见程度。
让我们来做个简单的计算:假设你对随机抽取的 10,000 人进行了这种测试。其中大约 10 人患有这种疾病,因此其中 9 人的检测结果会呈阳性。另一方面,在你选择的人中,约有 9990 人不会患病。由于该测试在 10% 的情况下会给健康人显示阳性结果,因此这 9990 名健康人将产生约 999 个假阳性测试结果。因此,在对 10,000 人进行检测后,你总共会得到 1,008 个阳性结果,而其中只有 9 个(略低于 1%)是真正患病的人。
同样,在处理极端概率的情况时,考虑一下几率会有所帮助。一个有力支持假设的证据(如刚才描述的可靠医学测试)可能会使该假设的几率乘以 10 倍,甚至 100 倍。但是,如果几率一开始就足够小,那么乘以 10 就会从千分之一的几率变成百分之一的几率。
2.5 子群体并不总是反映整体
贝叶斯学家经常使用条件概率。当你考虑某些特征在群体的一个子群体中有多普遍时,条件概率就产生了。如果你随机选取一个美国人,他们不太可能喜欢用无酵饼皮、上面涂上普罗维尔奶酪、切成方形的披萨。但如果假设这个人是在圣路易斯长大的,那么他喜欢这样一个怪东西的可能性就要高得多。
条件概率的表现可能与直觉相反。人们认为显而易见的简单原理,却可能以惊人的方式失效。最明显的例子就是辛普森悖论。
希望我们每个人在生活中都能学到,不要从单一的例子中得出笼统的结论,也不要认为一小部分人就能代表整个群体。如果一个外国人只通过访问圣路易斯来判断美国人对比萨的喜好,那将会被严重误导。由于粗心大意或运气不佳,我们可能会偶然发现一个与其他人群不同的亚群,从而带有一般人群所没有的特征。
但辛普森悖论所展示的东西比这更奇怪:有时一个群体中的每个亚群都具有某种特质,但这种特质在整个群体中仍然没有表现出来。
在 2016-17 NBA 赛季,詹姆斯-哈登(当时效力于休斯顿火箭队)的两分球命中率高于德玛尔-德罗赞(效力于多伦多猛龙队)的两分球命中率。哈登的三分球命中率也高于德罗赞。然而,德罗赞的总命中率(两分球和三分球命中率之和)却高于哈登。
哈登在两分球和三分球上都做得更好,而这两种投篮才是影响命中率的因素,但德罗赞的整体命中率却更高。这怎么可能呢?
职业篮球爱好者都知道,对于任何球员来说,两分球都比三分球更容易命中,但哈登却固执地坚持“为难“自己。在 2016-17 赛季,他尝试的每种投篮次数几乎相同(三分球 777 次,两分球 756 次),而德罗赞尝试的两分球是三分球的 10 倍多。尽管哈登在每种投篮方式上都更胜一筹,但德罗赞做出了战略性的决定:高命中率的投篮次数要比低命中率的投篮次数多得多。因此,他的整体成功率更高。
20 世纪 70 年代,在对加州大学伯克利分校研究生院的性别偏见进行调查时,也出现了同样的现象。1973 年,44% 的男性申请者被伯克利的研究生院录取,而只有 35% 的女性申请者成功被录取。然而,一项统计研究发现,各个院系(实际做出录取决定的院系)录取男女生的比例基本相当,甚至录取女生的比例更高。问题在于,有些院系比其他院系更难录取(对所有申请者而言),而女性申请这些专业的比例过高。
当然,这并不能排除所有偏见的可能性;一项研究发现,女性申请更拥挤的领域,是因为她们没有本科数学背景,无法学习资金更充足(因此可以招收更多学生)的学科。但是,关于条件概率的更广泛的观点仍然存在:你不能假定总体人群反映了其子人群的趋势,即使这些趋势出现在所有的子人群中。你还必须考虑各亚群之间的特征分布。
三、划重点:如何像贝叶斯主义者一样思考?
1. 拥抱边缘。对任何事情都深信不疑是不理智的。不要把“不大可能”和“不可能”混淆。当考虑极其罕见的事件时,试着用概率而不是百分比来思考。
2. 证据支持使之成为可能的东西。证据支持使证据成为可能的假设。无论哪种假设使你看到的证据最有可能发生,都要增强你的信心。
3. 关注所有证据。考虑你所掌握的所有可能与假设相关的证据。一定要考虑到你是如何获得这些证据的。
4. 不要忘记你之前的观点。在了解一些证据后,你的信心应该取决于这些证据支持什么,以及在证据出现之前你是如何看待事物的。如果一个假设足够不可能,那么支持它的有力证据仍然不会让它变得可能。
5. 子群体并不总能反映整体。即使一种趋势在每个亚群中都存在,它也不一定适用于整个人群。还要考虑亚群之间的特征分布情况。
四、为何这很重要?
约瑟夫-巴特勒(Joseph Butler)说过:“概率是人生的指南。”贝叶斯教导我们使用这一指南,并随着我们生活的变化和学到的新东西而不断更新。
贝叶斯法则是一个等式;如果你想了解数字细节,可以在本指南末尾的资料中找到。但是,更新信念的基本方法是:从你之前的观点开始,考虑新证据,也就是你刚获得的所有信息,包括你对如何得到这些信息。在你提出的假设中,确定哪些使证据更有可能,然后将你的信心转移到这些方面。
你可能会问:先验观点从何而来?如果你是贝叶斯主义者,那么你在某项调查中所持的观点就会受到你过去收集的证据的影响。贝叶斯法则并不是只应用一次。每当你获得关于某个主题的新信息时,你都会更新对该主题的看法,这些新更新的看法为你未来的下一次更新提供了先验。你对世界持续不断的看法就像奥托-诺伊拉斯(Otto Neurath)笔下的船一样:“我们就像水手,在海上必须重建自己的船,却永远无法从底部重新开始……”。
没有两个人会有相同的证据过程,也没有两个人会有相同的人生观点。当我们遇到不同的观点时,应该牢记这些不同的道路。但是,我们也应该记住贝叶斯数学中的一个美丽片段:如果我们在每次更新观点时都应用贝叶斯法则,那么,无论我们的观点从何而来,收集越来越多的证据都很有可能使我们的观点越来越接近真理。只要我们不断学习,不断更新,贝叶斯指南就会指引我们到达目的地。
五、链接与书籍。
这篇文章中的许多内容和例子都来自我的著作《贝叶斯认识论基础》(Fundamentals of Bayesian Epistemology)(2022年)。这本书将带你了解所有数学细节,教你将贝叶斯主义应用于决策理论和证据支持理论,并将贝叶斯主义与其他统计流派进行对比。
乔纳森-韦斯伯格(Jonathan Weisberg)的在线开源书籍《奇点与终点》(Odds & Ends)是一本入门级读物。类似的还有达伦-布拉德利(Darren Bradley)的《形式认识论批判导论》(A Critical Introduction to Formal Epistemology,2015 年)。
在线《斯坦福哲学百科全书》(Stanford Encyclopedia of Philosophy)中有一篇名为《贝叶斯认识论》(Bayesian Epistemology)的出色文章,作者是林汉提(Hanti Lin),这篇文章将为你提供大量有关该主题的信息(数学、哲学、论证),而无需你阅读整本书。
在茱莉亚-加尔夫(Julia Galef)的YouTube频道“Measure of Doubt”上,有许多关于贝叶斯思想的哲学视频。她尤其擅长用清晰的图表说明相关的数字运算。加尔夫还主持播客“Rationally Speaking”。她与共同主持人马西莫-皮格柳奇(Massimo Pigliucci)在早期的一些节目中回答了有关贝叶斯主义的问题。
译者:TeresaChen