平衡木的艺术分和完成质量有关系吗?这个数据分析告诉你艺术扣分的猫腻。
——————
一般性我们会觉得选手如果失误多,观感下降,裁判艺术扣分也会相应增加,所以完成分扣越多,艺术分扣越多,就跟fs的pcs是一个道理。
但是单看一个选手或者一场比赛,似乎没有这种相关性。比如张清颖在EF的失误比TF更严重,但艺术扣分反而从0.467减少到0.400;再比如法囯选手Boyer在QF接连大晃,但艺术扣分却是优质的周雅琴的一半(0.167/0.333)。这两个例子告诉我们,选手的艺术分要和自己比较,而不同场次的艺术扣分尺度可能也有区别。
——————
如果把同一个队伍多位选手的得分综合,再根据四场比赛的情况,同时进行横向和纵向的比较,结果会如何呢?
我们取中、法、巴三囯的平衡木主力队员,把她们在QF、TF、EF和AA四场比赛的各项小分取平均值,每场比赛有多少人,就取多少人的平均数。(中囯队周张欧三人都没有比aa,表格一边空着不好看,把邱的分拿过来;法囯队是MDJDS、Boyer和Osyssek三人,没有人进EF;巴西队是Andrade、Saraiva和Soares三人;因为Biles的稳定发挥,用她的个人分数做一个对照组)
做这个数据研究,需要自创一个FIG不提供的数据:质量扣分。
完成扣分=质量扣分+艺术扣分。放在在第一张表中,就是:黄色=绿色+灰色
这张表格是对打分数据的精确反映,色块的体量残酷地体现了每支队伍每场比赛在每一项扣分的多少,同时也体现了每一项扣分在总扣分中所占的比例。
那么这张表具体要看什么呢?我们要看的是质量扣分和艺术扣分的相关性,也就是对比绿色色块和灰色色块的走势。
对数据敏感的人应该一眼就看出了规律和特例,在海量数据基础上,艺术扣分和质量扣分的的确确是正相关的。
——————
但有人可能会觉得,艺术分和完成分不在同个数量级,而且这些数据太细碎,看得眼花缭乱。没关系,我们再做一张表,把艺术扣分乘以十,让它和质量扣分在同个数量级。再按照0.5分为一个档次,对所有数据取近似。现在是不是一目了然了?
正常的打分就应该像拜尔斯的这样,同等质量的发挥,一样的艺术扣分。AA这一场拜拜艺术扣分相对较多,但是其他三支队伍同样相对较多,说明AA这一场裁判手更紧,好在一视同仁。
然而,同样的规律放在团体这一场就完全无效了。中囯队同样的平均质量,艺术分却遭到重扣;巴西艺术扣分也相对较多,但相对其他场次偏差较小。
最无法理解的是法囯队,TF和QF的艺术扣分几乎完全一样,都保持在高位。难道因为在QF的艺术分已经顶级,TF尽管完成得更好,艺术分已经无法再提高了吗?或许应该质疑的不是团体为什么没有更高的艺术分,而是为什么QF以2.5分的质量扣分拿到了0.2的最低团体艺术扣分,而到了TF和AA又完全不是这么回事了呢?
对比其他队伍,平均下来,巴西质量扣2分,艺术分扣0.25;中囯队质量扣2分,艺术分扣0.3;最惨的竟是拜拜,质量扣1.5,艺术分要扣到0.3。
某一场其他场次艺术扣分相对较少的的情况巴西队也存在,但法囯的严重程度是巴西的两倍,以至于法囯的质量扣分和艺术扣分没有呈现出任何相关性。
——————
归根结底,质量分和艺术分是否相关其实并不重要,重要的是我们可以以前者(毕竟质量扣分相对更客观)为参考系,检查后者是否存在相对的客观性和规律性,而通过寻找普遍规律,各种反常以及背后的原因就会暴露得更加彻底。
——————
最后附送一个不取平均数的版本,uu门可以具体情况具体分析(每个队伍都加了拜尔斯作为对照组,下方的条条是完成情况分档,条条越高失误越多)
——————
一般性我们会觉得选手如果失误多,观感下降,裁判艺术扣分也会相应增加,所以完成分扣越多,艺术分扣越多,就跟fs的pcs是一个道理。
但是单看一个选手或者一场比赛,似乎没有这种相关性。比如张清颖在EF的失误比TF更严重,但艺术扣分反而从0.467减少到0.400;再比如法囯选手Boyer在QF接连大晃,但艺术扣分却是优质的周雅琴的一半(0.167/0.333)。这两个例子告诉我们,选手的艺术分要和自己比较,而不同场次的艺术扣分尺度可能也有区别。
——————
如果把同一个队伍多位选手的得分综合,再根据四场比赛的情况,同时进行横向和纵向的比较,结果会如何呢?
我们取中、法、巴三囯的平衡木主力队员,把她们在QF、TF、EF和AA四场比赛的各项小分取平均值,每场比赛有多少人,就取多少人的平均数。(中囯队周张欧三人都没有比aa,表格一边空着不好看,把邱的分拿过来;法囯队是MDJDS、Boyer和Osyssek三人,没有人进EF;巴西队是Andrade、Saraiva和Soares三人;因为Biles的稳定发挥,用她的个人分数做一个对照组)
做这个数据研究,需要自创一个FIG不提供的数据:质量扣分。
完成扣分=质量扣分+艺术扣分。放在在第一张表中,就是:黄色=绿色+灰色
这张表格是对打分数据的精确反映,色块的体量残酷地体现了每支队伍每场比赛在每一项扣分的多少,同时也体现了每一项扣分在总扣分中所占的比例。
那么这张表具体要看什么呢?我们要看的是质量扣分和艺术扣分的相关性,也就是对比绿色色块和灰色色块的走势。
对数据敏感的人应该一眼就看出了规律和特例,在海量数据基础上,艺术扣分和质量扣分的的确确是正相关的。
——————
但有人可能会觉得,艺术分和完成分不在同个数量级,而且这些数据太细碎,看得眼花缭乱。没关系,我们再做一张表,把艺术扣分乘以十,让它和质量扣分在同个数量级。再按照0.5分为一个档次,对所有数据取近似。现在是不是一目了然了?
正常的打分就应该像拜尔斯的这样,同等质量的发挥,一样的艺术扣分。AA这一场拜拜艺术扣分相对较多,但是其他三支队伍同样相对较多,说明AA这一场裁判手更紧,好在一视同仁。
然而,同样的规律放在团体这一场就完全无效了。中囯队同样的平均质量,艺术分却遭到重扣;巴西艺术扣分也相对较多,但相对其他场次偏差较小。
最无法理解的是法囯队,TF和QF的艺术扣分几乎完全一样,都保持在高位。难道因为在QF的艺术分已经顶级,TF尽管完成得更好,艺术分已经无法再提高了吗?或许应该质疑的不是团体为什么没有更高的艺术分,而是为什么QF以2.5分的质量扣分拿到了0.2的最低团体艺术扣分,而到了TF和AA又完全不是这么回事了呢?
对比其他队伍,平均下来,巴西质量扣2分,艺术分扣0.25;中囯队质量扣2分,艺术分扣0.3;最惨的竟是拜拜,质量扣1.5,艺术分要扣到0.3。
某一场其他场次艺术扣分相对较少的的情况巴西队也存在,但法囯的严重程度是巴西的两倍,以至于法囯的质量扣分和艺术扣分没有呈现出任何相关性。
——————
归根结底,质量分和艺术分是否相关其实并不重要,重要的是我们可以以前者(毕竟质量扣分相对更客观)为参考系,检查后者是否存在相对的客观性和规律性,而通过寻找普遍规律,各种反常以及背后的原因就会暴露得更加彻底。
——————
最后附送一个不取平均数的版本,uu门可以具体情况具体分析(每个队伍都加了拜尔斯作为对照组,下方的条条是完成情况分档,条条越高失误越多)