伯克松悖论

伯克松悖论

Content #

伯克松悖论指的是当不同个体被纳入研究样本的机会不同时,研究样本中的两个变量 X 和 Y 表现出统计相关,而总体中 X 和 Y 却不存在这种相关性。

第一个例子是著名的“海军与平民死亡率”的例子。在 1898 年“美西战争”期间,美国海军的死亡率是 9%,而同期纽约市市民的死亡率为 16%。后来海军征兵部门就拿这个数据跟大家讲,待在部队里其实比大家待在家中更加安全。

这逻辑肯定是错误的,但是错误不在具体数据,而是这两组数据其实没有什么可比性。因为海军主要是年轻人,他们身强体壮、不会出现太多身体疾病;而纽约市民里面包含了新出生的婴儿、老年人、病人等等,这些人无论放在哪里,他的死亡率都会高于普通人。

所以,参军不能说比大家待在家中更加安全,但反过来你也无法证明待在家中就比参军更安全,因为比对的对象不是在同一个人群里,这就是伯克森悖论。

第二个例子,现在的城市女孩会觉得,对他很热情的男生往往都长得不帅,长得很帅的男生往往对她都不够热情。但其实帅和不帅并不是导致男孩热不热情的原因,只是因为只有长得帅或者对女生够热情的男生,才有更多机会和女孩子接触,你看下图就明白了,还是从局部看整体的逻辑不对。

第三个例子,现在我们有一个用户访谈的数据结果:购买某品牌产品的 100 人中,有 72% 的人说在一个月内看过该品牌的广告 ;而在未购买商品的 300 人中,有 76% 的人说一个月内没看到过这个品牌的广告。

通过这个数据我们能看到什么呢?我们可以下结论说是广告提高了我们的用户转化率吗?

这是不可以的,因为实际购买的人会对广告更有印象,而没有购买的人也许也看了广告,只不过他没有印象而已。因为统计范围不同,所以不能够根据这个数据给出转化率比较高的结论,然后大肆提高广告投放。

看上去有因果关系的数据,还要看数据集的比对性才可以给出数据最终的结果。

Viewpoints #

From #

11 | 因果倒置:星座真的可以判定你的性格吗?