世界杯淘汰赛从 32 队选 16 支晋级,16 进 8……一直到最后决赛,全部都选中的概率是多少?
蟹妖!
来晚了,古典概型已经被讲过了,那么我们来谈谈基于贝叶斯统计,也就是,每看一次比赛根据结果来更新猜测的猜法~
爪机好像没法儿打公式。。。那先占个坑,一会儿换电脑再写呜呜。
接下来是拥有先验的(老)球迷的时间!比较简单粗暴的建模,具体优化算法及化简读者自证不难。【经评论区提醒,这里的算法没有考虑到淘汰赛的具体赛制是小组第一锤小组第二,只做成了简单的抽签】
我们赋予32队以 1,\cdots,32 的编号,记 i 队的先验胜率 P(\theta_i)=p({\theta_i}) ,记 i 队和 j 队比赛 i 队获胜的概率 P( X_{i,j} | \theta_i ) 为 p_{i,j} ,以及若观察到 i 队和 j 队比赛,则是 i 队获胜的概率P(\theta_i | X_{i,j}) = \frac{P(X_{i,j}|\theta_i)P(\theta_i)}{P(X_{i,j})}=\frac{p_{i,j}p(\theta_i)}{P(X_{i,j})} .
32进16
为了记号方便,我们直接快进到已经钦定了 i 队要分别跟 j , k, l 踢小组赛,即: P(X_{i,j})=P(X_{i,k})=P(X_{i,l})=1,否则,有兴趣的读者只需要自行使用古典概型计算 P(X_{i,j}) , P(X_{i,k}) 以及 P(X_{i,l}) 即可。
记小组赛期间,比赛获胜积分1,否则0,并假设两场比赛之间是独立的。
那么,i 队小组赛积分 S_i = 0,1,2,3 的概率分别为:
P(S_i=3)=P(\theta_i | X_{i,j} )P(\theta_i | X_{i,k} )P(\theta_i | X_{i,l} )=p_{i,j}p_{i,k}p_{i,l}(p(\theta_i))^3
P(S_i=2)=P(\theta_i|X_{i,j})P(\theta_i|X_{i,k})(1-P(\theta_i|X_{i,l}))+P(\theta_i|X_{i,k})P(\theta_i|X_{i,l})(1-P(\theta_i|X_{i,j}))+P(\theta_i|X_{i,j})P(\theta_i|X_{i,l})(1-P(\theta_i|X_{i,k}))=p_{i,j}p_{i,k}p^2(\theta_i)+p_{i,k}p_{i,l}p^2(\theta_i)+p_{i,j}p_{i,l}p^2(\theta_i)-3p_{i,j}p_{i,k}p_{i,l}p^3(\theta_i)
P(S_i=1)=P(\theta_i|X_{i,j})(1-P(\theta_i|X_{i,k}))(1-P(\theta_i|X_{i,l}))+P(\theta_i|X_{i,k})(1-P(\theta_i|X_{i,l}))(1-P(\theta_i|X_{i,j}))+P(\theta_i|X_{i,j})(1-P(\theta_i|X_{i,l}))(1-P(\theta_i|X_{i,k}))=p_{i,j}p(\theta_i)(1-p_{i,k}p(\theta_i))(1-p_{i,l}p(\theta_i))+p_{i,k}p(\theta_i)(1-p_{i,l}p(\theta_i))(1-p_{i,j}p(\theta_i))+p_{i,j}p(\theta_i)(1-p_{i,l}p(\theta_i))(1-p_{i,k}p(\theta_i))
P(S_i=0)=(1-P(\theta_i | X_{i,j} ))(1-P(\theta_i | X_{i,k} ))(1-P(\theta_i | X_{i,l} ))=\Pi_{\alpha=j,k,l}(1-p_{i,\alpha}p(\theta_i))
i 队要出线,则至少 S_i\ge2 ,于是32进16,i 队出线的概率 P_{32进16,i} 为 P(S_i=2)+P(S_i=3)=p_{i,j}p_{i,k}p^2(\theta_i)+p_{i,k}p_{i,l}p^2(\theta_i)+p_{i,j}p_{i,l}p^2(\theta_i)-3p_{i,j}p_{i,k}p_{i,l}p^3(\theta_i)+p_{i,j}p_{i,k}p_{i,l}(p(\theta_i))^3=p_{i,j}p_{i,k}p^2(\theta_i)+p_{i,k}p_{i,l}p^2(\theta_i)+p_{i,j}p_{i,l}p^2(\theta_i)-2p_{i,j}p_{i,k}p_{i,l}p^3(\theta_i)
16进8
重新抽签抽到某组的概率是 1/15
与原在同小组的队伍相遇
不妨设和 i 队一起出线的是 j 队。
此时, P_{16进8}(X_{i,j})=[(P(S_i=3)+P(\theta_i|X_{i,j})P(\theta_i|X_{i,k})(1-P(\theta_i|X_{i,l}))+P(\theta_i|X_{i,j})P(\theta_i|X_{i,l})(1-P(\theta_i|X_{i,k})))P(\theta_j|X_{j,k})P(\theta_j|X_{j,l})(1-P(\theta_j|X_{i,j}))+(P(S_j=3)+P(\theta_j|X_{i,j})P(\theta_j|X_{j,k})(1-P(\theta_j|X_{j,l}))+P(\theta_j|X_{i,j})P(\theta_j|X_{j,l})(1-P(\theta_i|X_{i,k})))P(\theta_i|X_{i,k})P(\theta_i|X_{i,l})(1-P(\theta_i|X_{i,j}))]\times\frac{1}{15}
与原在不同小组的队伍相遇
记相遇的队伍为 j_{\alpha},\alpha=1,\cdots,14 ,则
P_{16进8}(X_{i,j_{\alpha}})=P_{32进16,i}P_{32进16,j_\alpha}\times\frac{1}{15}
于是, P_{16进8,i}=P_{16进8}(\theta_i | X_{i,j}) +\sum_{\alpha=1}^{14}P_{16进8}(\theta_i | X_{i,j_{\alpha}}) = \frac{P(X_{i,j}|\theta_i)P(\theta_i)}{P_{16进8}(X_{i,j})}+\sum_{\alpha}\frac{P(X_{i,j_{\alpha}}|\theta_i)P(\theta_i)}{P_{16进8}(X_{i,j_{\alpha}})}
8进4
记抽签相遇的队伍为 j_\beta,\beta=1,\cdots,7 ,则
P_{8进4}(X_{i,j_{\beta}})=P_{16进8,i}P_{16进8,j_{\beta}}\times\frac{1}{7}
于是,
P_{8进4,i}=\sum_{\beta}P_{8进4}(\theta_i | X_{i,j_{\beta}})=\sum_{\beta}\frac{P(X_{i,j_{\beta}}|\theta_i)P(\theta_i)}{P_{8进4}(X_{i,j_{\beta}})}
4进2(半决赛)
记抽签相遇的队伍为 j_\gamma,\gamma=1,2,3 ,则
P_{4进2}(X_{i,j_{\beta}})=P_{8进4,i}P_{8进4,j_{\gamma}}\times\frac{1}{3}
于是,
P_{4进2,i}=\sum_{\gamma}P_{4进2}(\theta_i | X_{i,j_{\gamma}})=\sum_{\beta}\frac{P(X_{i,j_{\gamma}}|\theta_i)P(\theta_i)}{P_{4进2}(X_{i,j_{\gamma}})}
2进1(总决赛)
记总决赛对手为 j_{*}
P_{2进1}(X_{i,j_{*}})=P_{4进2,i}P_{4进2,j_{*}}
于是,
P_{2进1,i}=P_{2进1}(\theta_i | X_{i,j_{*}})=\frac{P(X_{i,j_{*}}|\theta_i)P(\theta_i)}{P_{2进1}(X_{i,j_{*}})}
特别的,当队伍胜率与对手无关时,结果与目前最高赞的古典概型结论一致。
,如果不考虑分组,32选16一共有 {32 \choose 16}= 601080390 ,即6亿多种可能性。
同理16选8有12870种可能性。
8选4有70种可能性。
4选2有6种可能性。
2选1有2种可能性。
全部综合起来有6498兆1598亿8021万2000种可能性
换句话说,中国人所有人每分钟猜一次平均要猜8-9年才能猜中答案。
当然,考虑分组实际情况要少很多,
每个小组出线2位有 6\times 2=12 种可能性(决定一二名次),8个组总共有 12^8=429981696 种可能性。
16强赛有 2^8=256 种可能性。
四分之一赛有16种可能性。
半决赛有4种可能性。
决赛有2种可能性。
全部综合起来只有14兆896亿4021万4528种可能性。如果要猜中季军再乘以2。
这个就简单多了,中国人所有人每分钟猜一次7天能搞定。
以上都是完全没有考虑足球常识的盲选,实际上不同情况的几率不同,一个了解足球的资深球迷应该会避免某些选择。
这里可以借鉴一个大型实验:美国每年三月会进行全美大学生篮球联赛,被选入NCAA大赛的68支球队会打一个巨型淘汰赛决出最后的冠军,这项赛事在美国被称为March Madness。
这项赛事一共算上一开始的4场预赛和后面的63场比赛共67场比赛,2010年代里巴菲特多次悬赏所有能猜中全部67场比赛赛果的人,悬赏金最高一度达到10亿美元。
67场比赛的不同可能性是我们上面第一种情况的2万多倍。很显然,从来没有人赢下过这项选择。在一些爆冷的年份甚至没有人能预测对32强。
现在假设今年世界杯没有那种一下子就毁掉所有预测的大冷门,根据一般业界评估:篮球的冷门情况比足球少一点,但是大学篮球比职业篮球冷门多一些。我们近似用NCAA的数据来看。
最好的情况是2017年,那一年直到16强之前几乎没有爆出冷门,当时1880万个预测中有18个预测猜中了16强,即预测正确了52场比赛的结果,这个几率纯粹从概率上来讲只有4500兆分之一,接近以上第一种情况。而实际结果是约100万分之一(1880万有18个中的)。换句话说,在极端情况下资深球迷猜测可以比盲猜准40多亿倍。
在这种情况下,以上第二种情况的几率就会减少为3200分之一。理想情况下如果没有大冷门,专业球迷的几千种猜测会有一种中标。
'