划时代的nba高阶数据rapm的算法是在2010年,由josephsill在mit斯隆体育分析会议上,第一次正式出现在了nba联盟中。
从此,对于真伪大腿,伪超巨的争论至少在联盟总经理、高级球探之间就不存在了。
还在乐此不疲争吵不休的,就剩下球迷,网红主播,还有一些自认为超巨的球星。
它的核心算法是根据公式的自变量和权重系数来出结果。
自变量是什么?把某球员当成一个自变量,1代表他上场,0代表没有上场。然后把主客队所有球员的5+5这个组合以100个回合来作为因变量。然后统计出整个赛季高达400+自变量和十万+等式,最终把这个超级方程式进行【岭回归】运算。
最终得出球员每100回合正负值的贡献,这个就叫做原始正负值。
而权重系数是通过回归分析得出的,这个是题外内容,以后有机会概述。
通过这个算法,我们就可以精准的把抱大腿的球员、被队友拖累的球员、错峰出行的球员(就是打弱队,避强队)、数据刷子的球员分辨出来。
作为球队的总经理,就会很清楚每一个球员对球队的贡献值。
rapm是一种较为完美的逻辑算法,因为他忽略了基础数据,例如得分,篮板,助攻等。
你可以得分,可以干脏活,可以接甩锅球,但凡你在球场上做的事帮助到球队得分或没被得分,都会被精准的捕捉到,变成你的正负值。
从2010年后,rapm就成了一体化高阶数据的基础支撑。
但即使它很完美,rapm还是存在天然的缺陷,例如需要3年甚至更多的比赛样本,岭回归运算不完美,需要pbp单场详情数据。
当然,它已经是目前nba最好的工具,来评判球员的真实价值,并且得到了论证。(rapm也被称为球星专属,在联盟打球没有坚持3-5年,是根本无法去计算。)
邓肯、库里、奥尼尔、加内特、韦德、詹姆斯、杜兰特、科比都在某个阶段处于整个联盟rapm最高序列。
那么,如何把这个算法,运用到选秀中呢?
那就要是用到pbp,全名play-by-play。
翻译过来就是单场个人全面数据统计。不是简单核算得分篮板助攻盖帽,而是具体详细到你在哪个点得分,什么位置抢板,助攻是阵地战还是攻防转换,包括防守是外线还是内线,包夹还是协防下的抢断,以及对方在什么位置出手未命中等等。