世界杯淘汰赛从 32 队选 16 支晋级,16 进 8……一直到最后决赛,全部都选中的概率是多少?

2022-12-01 16:00:13
世界杯火热开赛,谁是你心中的冠军队伍?快去为你支持的球队助威吧!2022.11.18-12.18 世界杯期间,参与球队助威,即有机会瓜分盐粒奖池。助威次数越多,助威球队每场获胜后瓜分赢取的盐粒越多。每日达成任务成就还可获得额外创作分奖励,加速获得助威次数。点击下方链接,马上去助威吧! 为你支持的球队助威,赢知乎盐粒>>>'

蟹妖!

来晚了,古典概型已经被讲过了,那么我们来谈谈基于贝叶斯统计,也就是,每看一次比赛根据结果来更新猜测的猜法~

爪机好像没法儿打公式。。。那先占个坑,一会儿换电脑再写呜呜。


接下来是拥有先验的(老)球迷的时间!比较简单粗暴的建模,具体优化算法及化简读者自证不难。【经评论区提醒,这里的算法没有考虑到淘汰赛的具体赛制是小组第一锤小组第二,只做成了简单的抽签】

我们赋予32队以 1,\cdots,32 的编号,记 i 队的先验胜率 P(\theta_i)=p({\theta_i}) ,记 i 队和 j 队比赛 i 队获胜的概率 P( X_{i,j} | \theta_i )p_{i,j} ,以及若观察到 i 队和 j 队比赛,则是 i 队获胜的概率P(\theta_i | X_{i,j}) = \frac{P(X_{i,j}|\theta_i)P(\theta_i)}{P(X_{i,j})}=\frac{p_{i,j}p(\theta_i)}{P(X_{i,j})} .

32进16

为了记号方便,我们直接快进到已经钦定了 i 队要分别跟 j , k, l 踢小组赛,即: P(X_{i,j})=P(X_{i,k})=P(X_{i,l})=1,否则,有兴趣的读者只需要自行使用古典概型计算 P(X_{i,j})P(X_{i,k}) 以及 P(X_{i,l}) 即可。

记小组赛期间,比赛获胜积分1,否则0,并假设两场比赛之间是独立的。

那么,i 队小组赛积分 S_i = 0,1,2,3 的概率分别为:

P(S_i=3)=P(\theta_i | X_{i,j} )P(\theta_i | X_{i,k} )P(\theta_i | X_{i,l} )=p_{i,j}p_{i,k}p_{i,l}(p(\theta_i))^3

P(S_i=2)=P(\theta_i|X_{i,j})P(\theta_i|X_{i,k})(1-P(\theta_i|X_{i,l}))+P(\theta_i|X_{i,k})P(\theta_i|X_{i,l})(1-P(\theta_i|X_{i,j}))+P(\theta_i|X_{i,j})P(\theta_i|X_{i,l})(1-P(\theta_i|X_{i,k}))=p_{i,j}p_{i,k}p^2(\theta_i)+p_{i,k}p_{i,l}p^2(\theta_i)+p_{i,j}p_{i,l}p^2(\theta_i)-3p_{i,j}p_{i,k}p_{i,l}p^3(\theta_i)

P(S_i=1)=P(\theta_i|X_{i,j})(1-P(\theta_i|X_{i,k}))(1-P(\theta_i|X_{i,l}))+P(\theta_i|X_{i,k})(1-P(\theta_i|X_{i,l}))(1-P(\theta_i|X_{i,j}))+P(\theta_i|X_{i,j})(1-P(\theta_i|X_{i,l}))(1-P(\theta_i|X_{i,k}))=p_{i,j}p(\theta_i)(1-p_{i,k}p(\theta_i))(1-p_{i,l}p(\theta_i))+p_{i,k}p(\theta_i)(1-p_{i,l}p(\theta_i))(1-p_{i,j}p(\theta_i))+p_{i,j}p(\theta_i)(1-p_{i,l}p(\theta_i))(1-p_{i,k}p(\theta_i))

P(S_i=0)=(1-P(\theta_i | X_{i,j} ))(1-P(\theta_i | X_{i,k} ))(1-P(\theta_i | X_{i,l} ))=\Pi_{\alpha=j,k,l}(1-p_{i,\alpha}p(\theta_i))

i 队要出线,则至少 S_i\ge2 ,于是32进16,i 队出线的概率 P_{32进16,i}P(S_i=2)+P(S_i=3)=p_{i,j}p_{i,k}p^2(\theta_i)+p_{i,k}p_{i,l}p^2(\theta_i)+p_{i,j}p_{i,l}p^2(\theta_i)-3p_{i,j}p_{i,k}p_{i,l}p^3(\theta_i)+p_{i,j}p_{i,k}p_{i,l}(p(\theta_i))^3=p_{i,j}p_{i,k}p^2(\theta_i)+p_{i,k}p_{i,l}p^2(\theta_i)+p_{i,j}p_{i,l}p^2(\theta_i)-2p_{i,j}p_{i,k}p_{i,l}p^3(\theta_i)

16进8

重新抽签抽到某组的概率是 1/15

与原在同小组的队伍相遇

不妨设和 i 队一起出线的是 j 队。

此时, P_{16进8}(X_{i,j})=[(P(S_i=3)+P(\theta_i|X_{i,j})P(\theta_i|X_{i,k})(1-P(\theta_i|X_{i,l}))+P(\theta_i|X_{i,j})P(\theta_i|X_{i,l})(1-P(\theta_i|X_{i,k})))P(\theta_j|X_{j,k})P(\theta_j|X_{j,l})(1-P(\theta_j|X_{i,j}))+(P(S_j=3)+P(\theta_j|X_{i,j})P(\theta_j|X_{j,k})(1-P(\theta_j|X_{j,l}))+P(\theta_j|X_{i,j})P(\theta_j|X_{j,l})(1-P(\theta_i|X_{i,k})))P(\theta_i|X_{i,k})P(\theta_i|X_{i,l})(1-P(\theta_i|X_{i,j}))]\times\frac{1}{15}

与原在不同小组的队伍相遇

记相遇的队伍为 j_{\alpha},\alpha=1,\cdots,14 ,则

P_{16进8}(X_{i,j_{\alpha}})=P_{32进16,i}P_{32进16,j_\alpha}\times\frac{1}{15}

于是, P_{16进8,i}=P_{16进8}(\theta_i | X_{i,j}) +\sum_{\alpha=1}^{14}P_{16进8}(\theta_i | X_{i,j_{\alpha}}) = \frac{P(X_{i,j}|\theta_i)P(\theta_i)}{P_{16进8}(X_{i,j})}+\sum_{\alpha}\frac{P(X_{i,j_{\alpha}}|\theta_i)P(\theta_i)}{P_{16进8}(X_{i,j_{\alpha}})}

8进4

记抽签相遇的队伍为 j_\beta,\beta=1,\cdots,7 ,则

P_{8进4}(X_{i,j_{\beta}})=P_{16进8,i}P_{16进8,j_{\beta}}\times\frac{1}{7}

于是,

P_{8进4,i}=\sum_{\beta}P_{8进4}(\theta_i | X_{i,j_{\beta}})=\sum_{\beta}\frac{P(X_{i,j_{\beta}}|\theta_i)P(\theta_i)}{P_{8进4}(X_{i,j_{\beta}})}

4进2(半决赛)

记抽签相遇的队伍为 j_\gamma,\gamma=1,2,3 ,则

P_{4进2}(X_{i,j_{\beta}})=P_{8进4,i}P_{8进4,j_{\gamma}}\times\frac{1}{3}

于是,

P_{4进2,i}=\sum_{\gamma}P_{4进2}(\theta_i | X_{i,j_{\gamma}})=\sum_{\beta}\frac{P(X_{i,j_{\gamma}}|\theta_i)P(\theta_i)}{P_{4进2}(X_{i,j_{\gamma}})}

2进1(总决赛)

记总决赛对手为 j_{*}

P_{2进1}(X_{i,j_{*}})=P_{4进2,i}P_{4进2,j_{*}}

于是,

P_{2进1,i}=P_{2进1}(\theta_i | X_{i,j_{*}})=\frac{P(X_{i,j_{*}}|\theta_i)P(\theta_i)}{P_{2进1}(X_{i,j_{*}})}

特别的,当队伍胜率与对手无关时,结果与目前最高赞的古典概型结论一致。

,

如果不考虑分组,32选16一共有 {32 \choose 16}= 601080390 ,即6亿多种可能性。

同理16选8有12870种可能性。

8选4有70种可能性。

4选2有6种可能性。

2选1有2种可能性。

全部综合起来有6498兆1598亿8021万2000种可能性

换句话说,中国人所有人每分钟猜一次平均要猜8-9年才能猜中答案。


当然,考虑分组实际情况要少很多,

每个小组出线2位有 6\times 2=12 种可能性(决定一二名次),8个组总共有 12^8=429981696 种可能性。

16强赛有 2^8=256 种可能性。

四分之一赛有16种可能性。

半决赛有4种可能性。

决赛有2种可能性。

全部综合起来只有14兆896亿4021万4528种可能性。如果要猜中季军再乘以2。

这个就简单多了,中国人所有人每分钟猜一次7天能搞定。


以上都是完全没有考虑足球常识的盲选,实际上不同情况的几率不同,一个了解足球的资深球迷应该会避免某些选择。

这里可以借鉴一个大型实验:美国每年三月会进行全美大学生篮球联赛,被选入NCAA大赛的68支球队会打一个巨型淘汰赛决出最后的冠军,这项赛事在美国被称为March Madness。

这项赛事一共算上一开始的4场预赛和后面的63场比赛共67场比赛,2010年代里巴菲特多次悬赏所有能猜中全部67场比赛赛果的人,悬赏金最高一度达到10亿美元。

67场比赛的不同可能性是我们上面第一种情况的2万多倍。很显然,从来没有人赢下过这项选择。在一些爆冷的年份甚至没有人能预测对32强。

现在假设今年世界杯没有那种一下子就毁掉所有预测的大冷门,根据一般业界评估:篮球的冷门情况比足球少一点,但是大学篮球比职业篮球冷门多一些。我们近似用NCAA的数据来看。

最好的情况是2017年,那一年直到16强之前几乎没有爆出冷门,当时1880万个预测中有18个预测猜中了16强,即预测正确了52场比赛的结果,这个几率纯粹从概率上来讲只有4500兆分之一,接近以上第一种情况。而实际结果是约100万分之一(1880万有18个中的)。换句话说,在极端情况下资深球迷猜测可以比盲猜准40多亿倍。

在这种情况下,以上第二种情况的几率就会减少为3200分之一。理想情况下如果没有大冷门,专业球迷的几千种猜测会有一种中标。

'