2018俄罗斯世界杯球队哪支球队会夺冠?

原标题:2018世界杯来临在即,让AI告诉你谁最有可能夺冠

「雷克世界」编译:嗯~阿童木呀

导语:令广大球迷兴奋的2018年俄罗斯世界杯即将开始,对于球迷来说,每一届世界杯中,除了球员精湛的球技之外,惹人关注的还有对夺冠球队的预测。最近,多特蒙德工业大学(Technische Universit?t Dortmund)的Andreas Groll教授,根特大学(Ghent University)的Christophe Ley教授、Hans Van Eetvelde教授,慕尼黑理工大学(Technical University of Munich)的Gunther Schauberger教授比较了一些足球比赛得分的建模方法,并使用一种基于随机(决策)森林的建模方法,使用国际足联的排名,平均年龄和冠军联赛球员数量,国家人口比率,国内生产总值,甚至教练的国籍等因素,对2018年世界杯足球赛进行预测。

在这项研究中,我们比较了三种不同的足球比赛得分的建模方法,而这是根据它们在2002年至2014年四次国际足球联盟世界杯(FIFA World Cups)的所有比赛中进行的预测性表现进行的:泊松回归模型(Poisson regression models),随机森林(random forests)和排名方法(ranking methods)。前两种方法基于团队的协变量信息,而后一种方法估计足够的能力参数,而这些参数反映了当前团队的最佳实力。在这个比较中,在训练数据中表现最好的预测方法是排名方法和随机森林。然而,我们表明,通过将随机森林与来自排名方法的团队能力参数相组合作为附加的协变量,我们可以大大提高预测能力。最后,我们选择这种方法的组合作为最终模型,根据其估计,2018年世界杯将会被反复模拟,并获得所有参赛队伍的获胜概率。较之卫冕冠军德国,该模型略微偏向支持西班牙。此外,我们提供了所有球队在所有锦标赛阶段的生存概率以及最可能的锦标赛结果。

图1:样本表格显示了所涉及的团队的四组比赛和部分协变量的结果

就像之前的2014年世界杯一样,即将在俄罗斯举办的世界杯也引起了若干位建模师们的注意,他们试图预测出锦标赛的冠军。有一种方法已经为过去欧洲锦标赛(欧洲杯)和国际足联世界杯若干项赛事取得了合理的结果,这种方法是基于赌注登记经纪人(bookmakers)的几率中所包含的预期信息(Leitner、Zeileis和Hornik于2010年、Zeileis、Leitner和Hornik于2012年、2014年、2016年提出)。现在,对于这样的重要赛事,赌注登记经纪人在锦标赛开始之前为获胜者提供一个赌注。通过将若干家在线赌注登记经纪人的获胜几率汇总并将其转化为获胜概率,反向锦标赛模拟可用于计算特定于团队的能力,关于这一点可参阅Leitner、Zeileis和Hornik(于2010年提出)的论文。凭借球队特有的能力,所有单场比赛都可以通过配对比较进行模拟,因此,获得了完整的锦标赛课程。Zeileis、Leitner和Hornik(于2018年)预测巴西将以16.6%的概率赢得2018年世界杯,其次是德国(15.8%)和西班牙(12.5%)。

同样的三支球队被瑞士银行UBS的一组专家确定为最受欢迎的球员,但具有不同的概率和不同的顺序(Audran、Bolliger、Kolb、Mariscal和Pilloud,2018年):他们获得德国最受喜爱的球员,获胜概率为24.0%,其次是巴西(19.8%)和西班牙(16.1%)。他们使用一个基于四个因素的统计模型,而这四个因素将表明球队在比赛期间的表现将如何:Elo评分,球队在世界杯之前资格赛中的表现,球队在前几届世界杯锦标赛中的成绩和家庭优势。该模型通过使用前五场比赛的结果进行校准,并进行10,000次蒙特卡罗模拟(Monte

图2:条形图显示了,应用于FIFA世界杯2002—2014年数据中的随机森林中变量重要性,得分数量用作响应变量,论文第2部分描述的变量用作预测变量。

另一个被证明在预测之前的国际足球锦标赛(如欧洲杯或世界杯)结果中有价值的模型类,是泊松回归模型的类,它直接对两个竞争团队在单场比赛中的进球得分进行建模。设在i和j队之间的比赛中,Xi j和Yi j分别表示第一和第二队的目标,其中i,j∈{1,...,n},n代表锦标赛中球队的总数。假设Xi j?Po(λij)和Yi j?Po(μij),其中λij和μij表示相应泊松分布的强度参数(即期望的目标数量)。对于这些强度参数,存在几种建模策略,它们以不同方式将竞争团队的能力或协变量包括在内。

在最简单的情况下,泊松分布被视为(条件性)独立的,主要取决于团队的能力或协变量。例如,Dyte和Clarke(于2000年)将此模型应用于国际足联世界杯的数据中,并让两支参赛队伍的泊松强度取决于他们的国际足联排名。Groll和Abedieh(于2013年)以及Groll、Schauberger和Tutz(于2015年)分别对欧洲杯和世界杯数据分别考虑了一组潜在的有影响的变量,并使用L1惩罚方法来检测相关协变量的稀疏集。基于此,对2012年欧洲杯和2014年FIFA世界杯的赛事进行了预测。这些方法表明,当涉及到许多协变量和/或单变量的预测能力事先不明确时,正则化估计方法可能是有益的。

许多研究人员已经放宽了对条件独立性的强烈假设,并且引入了不同的可能性来将依赖分数考虑在内。Dixon和Coles(于1997年)首先确定了得分数之间的一个(轻微负)相关性。因此,他们引入了一个附加的依赖参数。然而,他们忽略了一个事实,即模型中的强度参数,包括两个团队的能力(或协变量)本身是相关的。因此,尽管以能力为条件,泊松分布被假定为独立的,但它们是边际相关的。Karlis和Ntzoufras(于2003年)提出用双变量泊松分布(bivariate Poisson distribution)对两个团队的得分进行建模,该分布能够解释得分之间的(正)相关性。尽管双变量泊松分布只能解释正相关性,但基于copula的模型也允许负相关性(可参见McHale和Scarf于2007年、McHale和Scarf于2011年或Boshnakov、Kharrat和McHale于2017年所提出的观点)。

图3:根据FIFA世界杯的100,000次模拟运行以及根据ODDSET赔率获胜的概率,为所有32支球队进入2018年世界杯足球赛不同阶段的预测概率(以百分比表示)。

然而,关于双变量泊松的案例,Groll、Kneib、Mayr和Schauberger(于2018年)提供了一些证据,如果两个竞争团队的高信息量协变量都包含在两个(条件性)独立泊松分布的强度中,那么比赛分数的依赖结构可以被适当地建模。他们包括了欧洲杯数据的一大组协变量,并使用提升算法(boosting approach)来选择一个用于预测2016年欧洲杯的稀疏模型。由于双变量泊松分布的依赖性参数从未被提升算法更新过,所以有两个(条件性)独立泊松分布就足够了。

与基于协变量的泊松回归模型密切相关的是基于泊松的足球队伍排名方法。主要思想是找到能够反映当前团队最佳实力的足够多的能力参数。以一组比赛为基础,然后通过最大似然法(maximum likelihood)估计那些参数。Ley、Van de Wiele和Van Eetvelde(于2018年)研究了各种泊松模型,并对它们的预测性能进行了比较。由此产生的最佳模型是独立泊松模型以及Karlis和Ntzoufras(于2003年提出)的最简单的双变量泊松分布。有趣的是,Ley等人(于2018年)发现,这些模型在国内联赛和国家队比赛中的表现都优于对手。这些基于统计力量的排名为国际足联的排名提供了一个有趣的选择。

一种完全不同的建模方法是基于随机(决策)森林(random (decision) forests),这是一种由Breiman(于2001年)提出的用于分类、回归和其他任务的集成学习方法。该方法起源于机器学习和数据挖掘社区,并且首先通过在训练数据上构建大量所谓的决策树进行操作的。然后,通过采用预测类的模式(在分类中)或平均预测值(在回归中)来总结单个树的预测结果。这样,与常规决策树相比,随机森林减少了过度拟合的趋势和方差,因此,它是常用的强大预测工具。在Schauberger和Groll(于2018年)的初步研究中,不同类型的随机森林已经与传统的计数数据的回归方法(如上述泊松模型),在包含2002 2014年FIFA世界杯的所有比赛的数据上对预测性能进行了比较。事实证明,随机森林提供了非常令人满意的结果,并且通常要优于回归方法。而且,他们的预测表现实际上要么接近甚至超过作为自然基准的赌注登记经纪人的表现。这些结果激励我们在目前的研究中使用随机森林来计算即将到来的2018年FIFA世界杯的预测。然而,我们将证明,如果能够对反映国家队目前的实力的团队能力参数进行充分的估计,并将其作为附加的协变量,随机森林现有的非常出色的预测能力可以得到进一步的改进提高。

北京时间2017年12月1日晚,2018年俄罗斯世界杯小组赛分组抽签揭晓,葡萄牙和西班牙同组,不过他们的同组对手不强,巴西和东道主俄罗斯获得上上签。

抽签首先按照分档的顺序,先抽第1档,再抽第2档,以此类推直到第4档。东道主俄罗斯自动进入A1位置,剩下的7支1档球队都是随机抽取,率先被抽出的球队按照小组字母顺序分别进入B1-H1。

不同于1档球队默认放在小组第一的位置,2、3、4档球队在被划分到某个小组后,还需要再抽取一个数字以确定在小组中的位置。该位置将决定各队具体赛程。在进行2、3、4档抽签过程中,有时需要进行跳组,以遵循以下原则:1、除欧洲外,相同大洲球队不能进入同组。2、每个小组至多2支欧洲球队。例如在FIFA的官方演示视频中,第2档中被抽出的哥伦比亚原本应该进入B组,但是由于B1巴西同样来自南美洲,因此哥伦比亚跳进C组以遵循大洲回避原则。

A组:俄罗斯、乌拉圭、埃及、沙特

B组:葡萄牙、西班牙、伊朗、摩洛哥

C组:法国、秘鲁、丹麦、澳大利亚

D组:阿根廷、克罗地亚、冰岛、尼日利亚

E组:巴西、瑞士、哥斯达黎加、塞尔维亚

F组:德国、墨西哥、瑞典、韩国

G组:比利时、英格兰、突尼斯、巴拿马

H组:波兰、哥伦比亚、塞内加尔、日本

  今天来和大家说一说此次世界杯比赛,都有哪些队伍有机会整一整4强比赛,最有可能进入4强的队伍有哪几支队伍呢,有喜欢的朋友跟我一起来看一看吧。

  首先来看巴西,在主教练蒂特的领导下,巴西队在南美区世界杯预选赛上,一骑绝尘,率先获得出线权,队内球星云集,内马尔作为核心,前锋线上有热苏斯,中场有我暴力鸟,后卫席尔瓦、阿尔维斯等等,个个都是绝顶高手,他们至少能获得四强。德国队是欧洲最稳的球队,勒夫手下的这支德国队,几乎找不到弱点,他们对于比赛的掌控,简直令对手窒息,这就是成熟球队应该具备的能力,如果欧洲选一个进四强,那首选是德国队。

  西班牙队流畅的打法,让他们总是能掌握球权,队中优秀的选手,让球队运转流畅,在预选赛中,3-0狂胜意大利,说明这只球队的能力,进入世界杯四强是绰绰有余的。法国队是新星不断涌现的球队,马夏尔、姆巴佩、登贝莱、博格巴等等,这一系列响亮的名字,代表着法国队是一支蒸蒸日上的球队,更是一支充满活力的球队,虽然德尚饱受争议,但是球队的战绩已经击退了质疑者。

  作为世界杯卫冕冠军的德国队仍然是世界上最强大的球队之一,他们的阵容均衡并且强大,在各个位置都有一流的球员,球队的实力和4年前相比并没有下降,更恐怖的是德国队的状态常年稳定,同时越到大赛战力就越强。其他任何想夺冠的列强若想登顶世界杯,那么就必须做好如何面对德国队的心理准备,世界上只有德国队才拥有这样的地位,这从侧面上表明了德国队仍然是当今世界最顶级的球队。

  客观的说,葡萄牙能够夺得欧洲杯冠军,就意味着也有夺得世界杯的能力。队中一批新人越来越成熟,再加上佩佩、夸雷斯马等老将仍然保持较高的水准,更重要的是在葡萄牙队中还拥有C罗这样的球王级球星,这确实让他们仍然拥有一定的底气。通过2016年欧洲杯的夺冠历程,让这批葡萄牙球员们明白了如何去争夺冠军,如果分组情况再一样的理想些,然后再加点运气,葡萄牙夺冠也是完全有可能的。

  英格兰,英格兰作为欧洲中国队,但是预选赛踢的还是可以的,主教练还算靠谱,球员也大都在英超效力,实力还算可以,近些年欧洲拉丁派教练和意大利教练也是云集英超,直接的结果就是英超的风格慢慢转向技术流派,英格兰的球员能力也是逐步的向技术派看起,但是冰冻三尺非一日之寒,以目前的英格兰来看,要想夺冠还为时尚早。看好八强,封顶四强。

  智利,智利的这些年的确有崛起的形式,也涌现了不少球星,细腻的技术外加不惜体能的疯跑的确让智利这两年很是风骚,但是智利有个致命的弱点就是身高,面对欧洲二流的傻大个或者细腻的南美球队弱点不是很明显,但是一旦对阵德国、法国、西班牙这样同时兼并技术身体的球队要吃亏不少,所以智利很难在世界杯有更大的突破,但是小组突围或者进入八强还是很大可能的。

我要回帖

更多关于 2018俄罗斯世界杯球队 的文章

 

随机推荐