概率也会欺骗你

一个违反直觉的概率问题

有一道包含四个选项的单选题,你发现你完全不知道该怎么做。在不考虑「三短一长选一长」「遇到不会就选 C」的玄学答题法时,你有一个机会去掉一个错误选项,然后就只能随机瞎选。请问这时你选到正确答案的概率是多少?

老师,这道题我会答,是 1/3!

恭喜你答对了!没去掉错误选项时,答对概率是 1/4,去掉就只剩三个选项了,所以是 1/3。

规则变一下,你先在四个选项中选一个,然后老师在剩下的三个选项中去掉一个错误答案,请问你要不要更改答案?

这就要看改与不改,正确的概率分别是多少了。

  • 如果不改,因为老师总能去掉一个错误答案,这件事有没有对你没有任何影响(因为你没改答案)。所以正确率仍为 1/4
  • 如果改,没去掉选项前剩下选项的正确率之和为 3/4,去掉一个错误选项,其他两个选项的正确率为: 3/4 ÷ 2 = 3/8。所以改答案更优。

哈?

不懂没关系,我们换个极端的情况,有 100 个选项,你选了 1 个,老师去掉了错误的 98 个,问你要不要改成没去掉的那一个?

老师你当我傻比吗?你没去掉那一个,正确率是 99%!当然要改。

一个是先去掉再选,一个是先选再去掉,这里面有什么区别?

有区别,老师去掉错误答案时,是告诉你一个信息:去掉的选项,是 100% 错误的。这样你的概率空间就缩小了。100 个选项情况下,你选某一个时,概率空间仍是完整的,100 选 1。你选的正确率是 1%,剩下的 99 个选项平分 99% 正确率(每个 1%)。老师去掉了 9 8个错误选项,是告诉你这98个选项的正确率都是 0%。所以那个没去掉的选项就独得 99% 正确率。

有没有信息,能影响一件事情的概率分布。比如一个 6 位数的密码,你什么信息也不知道,和你已知前 5 位数,猜对的概率有天壤之别。再看下一题:

  1. 已知老王有两个孩子,老大是男孩,请问老二也是男孩的概率是多少?
  2. 已知老王有两个孩子,其中有一个是男孩,请问另一个也是男孩的概率是多少?
  3. 已知老王有两个孩子,老大是周二出生的男孩,请问老二也是男孩的概率是多少?
  4. 已知老王有两个孩子,其中有一个是周二出生的男孩,请问另一个也是男孩的概率是多少?

冷静!先把刀放下,我先揭晓一下正确答案:1/2, 1/3, 1/2, 13/27。

第一题,很简单,独立同分布,老大是男是女不影响老二的性别。1/2

第二题和第一题区别在哪呢?想像一下出题人出第一题的时候,他只需要看老大的性别就可以跑来问你了,可能老二他见都没见到。但第二题呢,他可能观察了两个孩子的性别,然后告诉你其中有一个是男孩,问你另一个的性别。我们不知道这孩子是男是女,也不知道他是老大老二,它的概率空间比第一题要大了。有可能这个孩子是老大,是男孩,那老二是男是女都无所谓(根据题设)。也有可能这个孩子是老二,是女孩,那老大就必须是男孩。所以我们需要列出两个孩子性别的联合分布:男男,男女,女男,女女。女女这个情况已经被观察者去掉了,所以剩下三种情况,另一个也是男孩(男男)的概率是 1/3。

当然,第一题也可以列联合分布来做,去掉的是(女男、女女),剩下两种情况,男男的概率是 1/2。可以发现,给定其中一个孩子的性别,另一个孩子性别的分布没有变化,仍是 1/2,这就是独立分布的意义。

第三题,同样,出题人没有给出任何第二个孩子的信息,第二个孩子的性别是独立的, 1/2。就算你说破大天,说老大是大队长三好学生钢琴十级,仍然没有 P 用。老二是男孩子的概率还是 1/2。

第四题,出题人问的是另一个孩子的性别,又没问星期几出生,你告诉我老大是周二出生有什么用,Who TM cares? No, no, no(摇手指)。这就是多余的信息起到的微妙的作用。出题人也要观察两个孩子,问他娘,老王的媳妇他们是周几出生的,才能告诉你这个信息。有三个维度:排行、性别、周几出生,概率空间又扩大了。我们用 B 表示男孩子,G 表示女孩,周几出生用 数字 表示,比如 2B 是周二出生的男孩。列出所有包含 2B 的情况:

	| 2B 1B | 2B 2B | 2B 3B | 2B 4B | 2B 5B | 2B 6B | 2B 7B |
	| 2B 1G | 2B 2G | 2B 3G | 2B 4G | 2B 5G | 2B 6G | 2B 7G |
	| 1G 2B | 2G 2B | 3G 2B | 4G 2B | 5G 2B | 6G 2B | 7G 2B |
	| 1B 2B | 3B 2B | 4B 2B | 5B 2B | 6B 2B | 7B 2B |

其中两个男孩的情况(第一行和最后一行)占总数的 13/27,略小于 1/2。可以想像,条件给的越精确,这个数会越接近 1/2。

现在大家都喜欢把「薛定谔的猫」当段子讲,其实它的原理跟上面的例子一样:因为我们的观察,获得了信息,导致了概率分布的改变。原来是一半生一半死,一观察,就变成 100% 的生或死了。

最后编辑于
知识共享协议
本作品采用CC-BY-SA许可.