开启辅助访问 购买速递币 快速注册 找回密码 切换风格

科研速递论坛

905

主题

3

好友

18

积分

炉火纯青

Rank: 4

科研币
70
速递币
649
娱乐币
2597
文献值
0
资源值
180
贡献值
0
跳转到指定楼层
楼主
发表于 2014-6-19 13:58:10 |只看该作者 |倒序浏览
数学世界杯:泊松分布预测巴西世界杯冠军
2014年06月17日 12:18  《科学美国人》中文版

  巴西世界杯已经拉开华丽的大幕,每个人的心目中都有自己预测的赢家。

  自从大草原竞走比赛诞生以来,观众们就开始预测结果并且在体育赛事上投下赌注;而近些年,一种与众不同的数据分析法逐渐雄踞赛事预测市场。高盛,彭博以及纳特·西弗尓的538(Five Thirty Eight)官网都利用数据,而并非直觉,来对比赛的结果做出最为准确。高盛预测本土作战的巴西有48.5%的几率拿下冠军;538给出的几率是45%,而彭博认为巴西夺冠的几率仅仅只有19.9%。

  这些数据从何而来?所有的数据分析专家都以数据为准,足球赛事预测网站也也需要参考过去比赛的结果。这样的分析方法有理可循。但大型的世界级足球比赛有限,所以分析员还要考虑如何评价在结果无可争议的国际足球友谊赛中,各支球队的表现。建模时,分析员还应决定收集多少相关数据——比如说,而五星巴西国家队光辉的战绩,是否会对队中年龄最大的球员(34岁)产生影响?以及如何利用个人球员在俱乐部(曼联和皇马等)的表现给他们做出适当的评价?

  不管数据的来源,分析员最后都会将其整合成模型。通常情况下,建模人员会把问题从“哪一支队伍会胜出”改为“X队和Y队比赛,X队会进多少个球”,这里使用到的是一种名为“双变量泊松回归分析法”(bivariate Poisson regression)。

  也许你并不熟悉这些名字,我们可以将其拆开来。“双变量”指的是,在做出某个单一结果的预测时需要参考两个相互影响的因素,比如一场比赛中的X队和Y队的表现。“回归分析法”指将即有数据填充到模型中去。而“泊松分布”则是很有趣的分析方法。

  试想像,你站在路旁,想要知道一分钟会有多少汽车急驰而过。首先,你必须收集数据。利用秒表和计数器,第一分钟,假设有15辆车驶过;第二分钟,18辆;而下一分钟只有4辆。持续记录下去,你就可以得到一个模型,这便是“泊松分布”的原型。这项分析方法是由法国数学家西莫恩·德尼·泊松提出,用于估测人们做出错误判断的几率。

  根据泊松分布,足球比赛的结果同样具有分散性。一支足球队进1或2个球的可能性最大,其次为不进或者进3个,而进4或5个球(或者更多)的几率则大大下降。于是建模人员会根据这支队伍之前的表现,通过泊松分布制图,预测出它们之后得分的情况。

  想要下注的人们看过来!截止本稿发布,网络博彩公司“必发”(BetFair)预测巴西将有24.4%的胜算。如果你相信高盛或者是538的预测数据,认为巴西有一半的夺冠几率,那么就赶紧下注吧!当然,估计有人即使读了高盛和538的分析,还是会一如既往地赌巴西24.4%夺冠。

  但问题是:赌民们怎么会比数据分析员知道的更多呢?

  
您需要登录后才可以回帖 登录 | 快速注册

发布主题 !fastreply! 返回列表 官方QQ群

QQ|Translate Forum into English|QQ群:821993|Archiver|手机版|申请友链| 科研速递论坛

GMT+8, 2024-11-16 21:49 , Processed in 0.053100 second(s), 26 queries .

© 2012-2099 www.expaper.cn

!fastreply! 回顶部 !return_list!