Content #
幸存者偏差就是当取得资讯的渠道仅来自幸存者时,我们得出的结论可能会与实际情况存在偏差。因为这样做看上去结果的确是由随机对照试验产生,但在逻辑上是错误的,这其实是在用结果来倒推整个前期数据的产生过程。
幸存者偏差这个概念来源于二战时期,那时候有各种地面防空作战和空战,在密集的炮火下,战机机身上几乎所有地方都可能中弹,因此需要用统计学研究战机被击中的部位,从而确定哪个部分需要额外加强装甲。
人们对返航的战机进行弹痕分析后发现,飞机机翼和尾部被打穿的弹孔较多,由此得出应该是加强机翼的装甲防护会更好。
但对返航的飞机样本来说,其实是说明即使机翼中弹,飞机也有很大的几率能够返航。对于那些弹孔不多的部位来说(比如驾驶舱、油箱和机尾),当这些部位中弹的时候,飞机很可能连飞回来的机会都没有了,而这并没有统计出来,这就是所谓的“看不见的弹痕最为致命”。最后事实也证明,加强弹孔较少部位的装甲防护是正确的。
世界杯的预测也是如此,这样大规模的赛事,会有很多人、很多生物参与赛果预测,如此大的样本量自然就诞生了本次预测的“幸运儿”,只是它的名字碰巧叫章鱼保罗罢了。没有章鱼保罗,我们还会有另一个“幸运儿”猫咪汤姆(这当然只是我杜撰的名字)。
在章鱼保罗之外,其实有很多的预测者“牺牲”在了随机概率里,它们不够“幸运”不能被我们看见,只有章鱼保罗足够幸运,成为了能够被我们看到的“幸存者”。另外,从章鱼保罗自身的预测结果来看,你会发现其实我们只是看到了它预测成功的部分,忽略了它也有预测不成功的时候,这也是另一种幸存者偏差。