商业
别拿相关当因果!因果的概念和寻找它的方法从何而来?
哲学、经济学、统计学以及逻辑学都有志于理清因果关系,克莱因伯格成功地将这些完全不同的方法以一种简单而又实用的方式综合在了一起。—— Chris Wiggins ,哥伦比亚大学副教授,《纽约时报》首席数据科学家
作者简介:
萨曼莎·克莱因伯格(Samantha Kleinberg)计算机科学专业博士,现任斯蒂文斯理工学院计算机科学专业副教授,致力于研究那些只可观而不可进行实验的系统的运行原理。
书籍摘录:
第 1 章 引子 (节选)
1999 年,一个名叫 Sally Clark 的英国律师被法庭判定谋杀了她的两个孩子。1996 年 12 月,她的第一个儿子在 11 周大的时候突然死亡。当时,人们认为孩子是自然死亡。但是就在第一个孩子夭折一年多以后,Clark 的第二个儿子又在 8 周大的时候死亡了。在这两个案件中,两个孩子似乎都没有什么生理上的疾病。于是,他们的突然死亡引起了人们的怀疑。
这两个案件有很多共同之处:孩子们死的时候年龄差不多,他们的死都是由 Clark 发现的,当时家里只有 Clark 和孩子在一起,而且验尸报告表明两个孩子身上都有伤。一开始,人们认为第一个孩子的伤是抢救时造成的。但是,第二个孩子死后,人们对孩子的伤重新做了检查,而这一次他们认为这些伤很可疑。第二个孩子死亡四周后,警方逮捕了孩子的父母,随后 Clark 被指控为谋杀罪并获刑。
同一个家庭的两个婴儿都死于婴儿猝死综合征(SIDS)的概率有多大?据英国检察官称,发生这种情况的可能性微乎其微,所以这两起死亡一定是谋杀所致。这一论据(一个原因的可能性几乎为零,所以一定还有另外一个原因)造成了这桩著名的冤案。这也是因为统计不当和忽视因果关系而造成严重后果的一个重要案例。
统计学家和因果关系研究者都知道这个案例,其主要原因在于,检方的论据本质上基于这样的逻辑:被告的辩词几乎不可能为真,所以一定是假的。检方为此请来了一位专家证人——Roy Meadow 博士。Meadow 称,同一个家庭发生两起 SIDS 事件的概率为七千三百万分之一。检方由此认为,因为这个概率非常低,所以这两起死亡事件不可能出于自然原因,一定是谋杀所致。
然而,这一统计数据完全是错误的。即使这个数据是正确的,也不应该这样用。有一份研究报告估算出发生 SIDS 的概率为 1/8543。Meadow 根据这个研究报告提出:同一个家庭发生两起 SIDS 事件的概率为 1/(8543×8543),即约七千三百万分之一。这种计算方法错误的原因在于,它假定这些事件是相互独立的。抛硬币的时候,无论硬币落地时是正面朝上还是反面朝上,都不会对下一次结果产生任何影响。因为每一次硬币正面朝上的概率都是 1/2,所以将第一次正面朝上的概率与第二次正面朝上的概率相乘所得出的结果就是连续两次正面朝上的概率,这从数学角度来讲是没有问题的。Meadow 当时也是这样计算的。
引发 SIDS 的原因还不确定,但一个很重要的影响因素是孩子所处的环境(比如家里是否有人吸烟和饮酒)。这意味着,如果一个家庭发生过一起 SIDS,那么这个家庭发生第二起 SIDS 的概率就会远大于 1/8543,因为这些孩子的生活环境和遗传基因都是相同的。也就是说,第一起死亡事件会向我们透露第二起死亡事件发生的概率。这个案例和一名演员获得两次奥斯卡金像奖的情况非常相似。金像奖并不是随机颁发的,演员第一次得奖时具备的品质(才华、知名度、人脉)会提高他再次得奖的可能性。
这就是 Clark 一案的症结所在。在这个案子中,两起事件并不是相互独立的,可能还是共同的原因引发的。因此,不能通过简单的乘法来计算这两起事件发生的概率。相反,在计算第二起事件发生的概率时,应该考虑到第一起事件的发生。所以我们需要知道的是,在一个已经发生过一起 SIDS 事件的家庭中,发生第二起SIDS事件的概率。本案中的概率在计算和使用方面都存在十分严重的问题,为此,被告在第一次上诉时请来了一位统计学家作为专家证人,皇家统计学会还专门写了一封信表达了他们对这个案件的关心。
不过此案的问题并不仅仅是误算概率那么简单。在整个案件中,检方试图将事件(即这两起SIDS死亡事件)发生的这七千三百万分之一的概率等同于 Clark 无罪的概率。这种错误的推理将事件发生的概率当成了被告有罪或者无罪的概率,这就是我们所说的检察官谬误。
我们知道,一个几乎不可能发生的事件真的发生了。一个家庭中发生两起 SIDS 死亡事件的可能性很小,但是一个家庭中两个婴儿都夭折的可能性也很小。人们不单单会考虑 SIDS 这一解释是否合理,更重要的是,他们会将其与关于这个事件的其他解释进行比较。因此在这个案件中,最好将同一个家庭中两个孩子都被谋杀(检方的假设)的可能性与同一家庭中两个孩子都患了 SIDS 的可能性进行比较。
一个家庭中两个孩子都死于 SIDS 的概率与这两个孩子都感染的概率是不同的。关于这个案件我们还有其他的证据,比如物证和犯罪动机等。必须将这些证据与概率结合起来看(比如说,一个人如果没有犯罪动机、没有作案机会或者没有行凶武器,那么他杀人的概率肯定要低于总谋杀率)。
最后,无论一件事情发生的概率有多低,只要尝试的次数足够多,最后一定会发生。Clark 一案中,那个误算出来的极低的概率(七千三百万分之一)比中百万大博彩的概率(二亿五千八百万分之一)还要高三倍多。一个人中大奖的概率是极低的,但是如果我们说某个地方的某个人会中大奖,这个概率又如何呢?那就高得多了。这就说明,仅通过概率来判断一个人的清白一定会导致一些冤案。这是因为虽然对某个特定的家庭来说,发生这种事件的可能性很小,但是世界上有两个孩子的家庭有上百万个,这种事件总会在某个地方的某个家庭发生。
2003 年 1 月,Clark 第二次上诉时终于翻案。然而,那时她已经在监狱服刑三年了。
为什么 Clark 案会成为因果推理失败的重要案例呢?尽管此案在计算概率的过程中存在很多问题,但最根本的原因是,此案试图用一个事件发生的概率来支撑某个特定的因果结论。“这只是巧合而已”“这个概率有多大”,当你在说服别人相信某个因果关系时,是否也说过这样的话呢?生活中经常有这样的推理:公司来了一名新员工,而同一天你的订书机不见了;一名巫师知道你最喜欢的女性亲属的名字以“M”开头;两名重要人证记得那名嫌犯穿的是一件红色法兰绒衬衫。但是,如果因某件事情不大可能发生,而说其唯一合理的解释就是因果关系,那一定是错误的。前面已经说过,一个不大可能发生的事件在某个人身上发生的概率也许极低,但是在某个地方发生的概率却不低。除了会造成冤案以外,错误的因果推理还可能会带来其他严重的后果,比如将大量的时间和精力浪费在绝不可能起作用的药品上,或者制定一些无用的、代价高昂的公共政策。
本书的目的是提高读者的因果推理能力。严谨的因果思维是指质疑假设、衡量证据、分析各种说辞,以及辨别我们无法得知事情发生原因的情况。有时我们可能无法获得足够的信息来建立因果联系,有时我们获得的信息可能并不是我们所需要的,但重要的是能够认识到这些问题,并与其他人就这些问题进行交流。通过阅读本书,我希望读者至少能够对他们所听到的各种因果推论多一些质疑(我们将讨论在因果推论中需要注意哪些危险信号,以及可以提出哪些问题来衡量这些推论),但首先我们会教大家如何寻找事件发生的原因、如何为因果关系提供强有力的证据,以及如何使用因果关系来指导我们日后的行为。
何为原因
试着花点时间,给“原因”下个定义。
如果你与上我的因果关系推理课的学生一样,那很可能定义下到一半就开始用各种可能的异议打断自己了。也许你用了“绝大多数时候”或“但并不总是这样”或“只有……”这样的字眼来限定自己的定义。而且你的定义很可能包括一些特征,比如:原因会导致某种结果、会使某种结果更有可能出现、具有产生某种结果的能力,或者会形成某种结果。这些特征体现了人们的一种普遍想法:事情的发生都是有原因的,否则它就不会发生。
尽管这种想法并不适用于所有情况,但在本书中,“原因”一词一般是指:它使某种结果更有可能出现,并且没有它某种结果就不会出现或者无法出现,或者说它能够在适当的环境下产生某种结果。
因果关系在日常生活如此重要,但在哲学上却没有一个公认的关于因果关系的理论,也没有什么万无一失的计算方法能帮助我们准确找到因果关系,这让人有点惊讶。但更棘手的是,由于人们对“原因”的定义不同,所以同一情况下,人们可能会将不同的因素视为事件发生的原因,但事件的真相可能并没有人知道。
比如说,鲍勃遭遇了抢劫,而且劫匪想要杀人灭口。但在抢劫的过程中,鲍勃心脏病突发,随后死亡。我们可以将鲍勃的死因归咎于生理机制(心脏病发作),并进一步追溯到心脏病的根源——遗传基因,这种基因大大增加了心脏病突发致死的概率。或者将鲍勃的死因归咎于抢劫事件,因为如果没有遭遇抢劫,鲍勃的心脏病就不会发作。这两种死因都解释得通,我们无法立即搞清楚哪个解释更合理,或者它们只是对一个事件的两种分析。此外,不要试图为事件找出某个唯一的原因。也许是心脏病发作和抢劫事件共同导致了鲍勃的死亡,这两个事件的影响是不可分割的。在第 8 章和第 9 章中,我们将再次分析这两件事对鲍勃的死亡所应承担的责任,并研究一些事件发生的原因(比如为什么会爆发某场战争)以及某些政策是否有效(比如禁止在酒吧吸烟的政策是否改善了纽约市的人口健康状况)。
尽管原因不易寻找又难以界定,但也不是毫无希望。答案并不像人们想象的那么清楚明了(我们没有神奇宝盒,不能从这头输入数据然后等它自动输出原因,并且输出绝对正确、万无一失),我们的大部分工作只是找出何时该用何种方法。关于原因的定义有很多不同的观点,这些观点给我们提供了很多种方法,这些方法或多或少都有点用,只是工作原理和适用的情形有所不同。如果能了解其中两种或以上的方法,并且了解它们之间是如何互补的,那么我们就能以多种方法来考察同一种情形了。有些方法适用的情形可能比较多(或者适用于对我们而言很重要的一些情形),但是请记住,没有哪种方法是十全十美的。尽管寻找原因很难,但一定要坚持不懈地去寻找正确的原因。如果能够坦然接受我们可能会犯错的事实,并且明确在何时能够找到什么,那么我们就可以不断地尝试,看看这些方法都能适用于哪些情形,至少能准确地描述出我们所使用的方法以及所得到的结果。本书重点阐述了各种方法的优势和局限性,而不是向读者推荐某些方法,因为这些方法都不是绝对的。数据不全时可能这种方法更有效,事件发生的时间很重要时可能那种方法更有效,总之,具体使用哪种方法要视情况而定。
题图来自:libreshot
原文链接 (已下线): https://www.qdaily.com/articles/56157.html
Wayback 快照: http://web.archive.org/web/20190623192839/https://www.qdaily.com/articles/56157.html
原始截图: http://ww3.sinaimg.cn/large/007d5XDply1g3yi7jzc9fj30u079fnpf