炉石作为最火的卡牌类游戏(我认为没有之一!),其目的肯定是为了增加游戏的公平性以及耐玩性。公平性作为耐玩性最大的基础也肯定会被暴雪公司所重视。但是同时有一些问题也引起玩家的注意,如下图所示。
主播雪妍在匹配中以天梯2W多名匹配到了5级选手,而这一现象并不少见。
主播姜神在匹配中以天梯374的高名次匹配到了1级选手。
主播狗贼在匹配中以天梯1864名匹配到了1级选手。
上面几幅炉石对战图所表现出来的匹配差异性很值得注意,由此我们就会有一些三个疑问:
1、为什么传说300多名可以匹配到1级选手?
2、1000多名也会匹配到1级选手,那为什么300名没有匹配到1000多名的呢?
3、2W多名匹配到的居然是5级选手?
而这看似不合理的匹配通常又变得非常合理,为了一探究竟以及回答上面所提出问题,接下来就为大家做一个全面的分析。根据2017年初设计师Max McCall在一则蓝贴里解释:我们使用一个公式来决定玩家技术水平。我们管这个评分叫MMR (Match Making Rating)。 在休闲和传说组,我们将两个类似MMR的玩家进行配对。
在传说之下的天梯模式,我们将两个星星数目相近的玩家配对,而不是使用MMR。你的评分是匹配系统收到的唯一输入变量。该系统不知道你的卡组,不知道你和你对手刚才使用的卡组,或者其他任何东西,它只知道你的评分。
而说到采用基于隐藏分(评分)的匹配算法,那八九不离十是采用电竞游戏常用的EOL评分系统,下面首先我们从算法公式入手进行剖析(下方进入公式区,请系好安全带,要开车了)。
ELO Rating System
根据维基百科的解释:ELO评分系统是一种用于广泛计算对抗比赛(例如象棋对弈)中对手双方技能水平的方法,它由Arpad Elo创建。形象的来说就是选手的积分最低1分,最高3000分。比赛胜利加分,失败扣分。低分胜高分,加分更多,高分胜低分,加分更少;低分负高分,扣分更少,高分负低分,扣分更多[1-3]。
根据维基百科的解释:ELO评分系统是一种用于广泛计算对抗比赛(例如象棋对弈)中对手双方技能水平的方法,它由Arpad Elo创建。形象的来说就是选手的积分最低1分,最高3000分。比赛胜利加分,失败扣分。低分胜高分,加分更多,高分胜低分,加分更少;低分负高分,扣分更少,高分负低分,扣分更多[1-3]。
在ELO系统中,评分(Rating)是最重要的变量,下面就为大家举个例子:
本段落涉及海量数学公式
友情提示看懵逼的请跳到下一段落
狗贼及姜神为待评价及比较的对象,传说排名为RA,RB,则两位高玩各自获胜的期望值是:(我们下面先用狗贼主播作为例子!)
(1)
(2)
EA是狗贼的期望值,EB是姜神的期望值。通常为了简化,不妨令,,400数字源于400算法(algorithm of 400),一般用来计算表现评分(performance rating),这样我们就可以看到更简练的表达式:
(3)
(4)
一般推论认为EA+EB=1,RA=1864(就是引用上图狗贼的传说排名)现在我们假设狗贼与4位水友进行了比赛。
1、狗贼输给了一个天梯名次为RB=1832的玩家,就是上一期那个奇数骑(Box君表示看到这里已经头昏脑胀了)
2、赢了一个天梯名次为RB=1677的玩家;
3、与另一位传说名次为RB=1588的无限战玩家打平;
4、赢了一个天梯名次为RB=998的玩家,只要998!
则狗贼的真实得分为:S=0+1+0.5+1=2.5
狗贼的期望得分为:E=0.546+0.746+0.830+0.993=3.115
此时我们再引出一个关于K值的公式,此处K值取16(传说比赛认为等同于专业运动员),其目的就是为了修正得分;
(5)
据此,经过四次比赛后狗贼的天梯名次为:
1864+16(2.5-3.115)=1816.
基于公式的分析我们不难发现2个疑点:
1、一般传说对战在输掉一场比赛后名次浮动很大,一般为几百名甚至上千名,但是这个公式经过5场对局仅仅浮动48名,是否偏差太大?
2、如果仅仅认为传说名次就是评分RA或者RB,那又如何界定传说之前的等级玩家呢?
首先解答第一个问题,炉石排名是基于成千上万个玩家进行排序,比如你刚输了一把,而与此同时,和你积分在同一水平的几百名玩家可能赢了这场比赛,因此这个浮动因素是必须要考虑进去的。在此,我们引入HA(Hearthstone A) 作为修正系数,HA取决于同水平玩家基数,因此式(5)就变成了
(6)
其实真正的算法比这个要复杂的太多,而我的目的也是为了让大家更了解匹配机制的最初算法机制。
针对第二个问题,官方回应也曾经提及过:在休闲和传说组,我们将两个类似MMR的玩家进行配对。在传说之下的天梯模式,我们将两个星星数目相近的玩家配对,而不是使用MMR (Match Making Rating) [6]。但是细心的玩家会发现,这句话并解释不了为什么300多名可以匹配到1级选手?
Box君个人认为炉石匹配机制首先选定的肯定是同等级玩家的匹配,比如1级的优先匹配肯定是1级玩家。但是炉石游戏匹配速度非常快,基本上几秒钟就已经匹配到对手了,但是基于这种比较快的算法机制下,就产生了一些问题,同等级玩家数量是有限的,很大程度上1级、2级玩家的数量是相对较少的,因此如果必须在限定时间匹配到对手,而同等级玩家数量又不匹配的话,只能在同时匹配的这些人中找评分最相近的。
再通过分析官方给出的回应我们就能清晰的了解这一疑惑了,比如姜神按下了传说阶段的“开始游戏”按钮,系统在开始匹配时会检查姜神的RA值(也就是官方所说的MMR),将其与队列中其他人的RB值进行比较。一种情况是找到了相同的,那就顺利匹配了;另一种情况就是找不到相同的RB值,因此就会匹配到最相近的对手。
如果短时间匹配到最相近MMR的对手远低于你的分段,那么就会出现传说玩家匹配到2级甚至5级的情况了。
炉石传说探底例证
早在2015年的时候就有玩家自告奋勇的进行探底[5],这位blue_54321玩家经过无数次坚决投降后,终于在6月30日的24:00得出这个结论:国服传说玩家为15203人。其中值得注意的是这位水友从30日晚上22:51到24:00的一系列测试可以看出这个玩家在探底的时候接触到的基本都是8~14级的玩家。
从这一点我们可以看出,这个玩家RA几乎已经降低到了最低值,因此匹配系统就相对应的让他匹配到了10级开外的玩家。
质疑声音[7-8]
其实各种质疑声音还是比较多的,面对以前毒瘤卡组横行的时代,某一套卡组一直被针对也是常事,而在此状况下导致选手心态崩盘的例子也数不胜数。
上图是板娘主播对于匹配机制的另一看法:暴雪将玩家的胜率拉近50%。而这一观点在百度贴吧也被另一位玩家所支持,如下图所示。
一方面,其实炉石设计师Max McCall对于玩家抱怨“对手的卡组总是针对我,是不是炉石系统在针对我?”早有了以下回应:当你进入游戏时,决定你对手的变量只有一个:你的技术评分[6]。炉石官方回应MMR 是他们使用的公式,其决定玩家技术水平。简而言之这个公式就是:
你的新评分=每局比赛的胜负+你和对手的当前技术评分+你的评分历史 [7]
另一方面,设计师承认暗中修改天梯中匹配机制[9]
这个改动最大影响就是在于大大的缩短了MMR分段,这也就意味着传说前20的选手优先匹配到的是前100的选手。
而对于这一改动,主播驴鸽也给出了自己的看法:
驴鸽说:“传说前100(排名靠前)的玩家进行天梯匹配的时候你的对手也基本上都是排名很高的选手,不会像以前一样,传说20名匹配到传说1万,我自己在玩的时候也是深有体会,昨天暴雪官方也承认了他们确实有内改传说分段的匹配机制,缩小了匹配空间。”
不过这个改动也带来了一个负面影响,因为同一个时间在高分段游戏的选手可能并不是很多,这些玩家就很容易出现连续匹配到一起很多把的情况,这就导致了国服水友经常说的石头剪刀布的问题,比如我用萨满输给了对手的宇宙法,我再马上进行匹配,因为很大概率还是匹配到刚才的对手,我就会换德鲁伊来counter对面的宇宙法,这样对面可能一个反心理,用了萨满来counter我的德...就变成了比较诡异的心理博弈了。主要还是当前环境下的卡组相互之前的克制关系过于明显,希望下个版本环境能变得相对友善吧。
因此,改动后的炉石匹配机制尽力的完善平衡这一机制,但是任何的改动都是有利有弊,就像主播驴鸽所说的改动后,匹配范围缩小了就很容易多次匹配到同一对手,而这也会反过来影响匹配的公平性。至于炉石匹配系统尽力将玩家胜率拉至50%一说,我认为一方面证据不足,另一方面针对机制很容易带来负面效果,因此对于暴雪这样一家巨头游戏企业来讲,不会轻易采用。
从另一个角度看,如果炉石系统真的想针对某一高胜玩家,就必须基于此玩家上一把的数据进行相应匹配克制。但从姜神最近的一次匹配中虽然频繁换了职业,但还是遇到了天克的对手就可以看出并非如此[10];
而且再从狗贼最近一次匹配中[11](防战VS奇数骑)又可以看出,虽然是劣势对局但未必不能取胜。因此从各种事实以及客观出发,小概率事件发生在某个玩家身上的情况还是存在的,当这种情况存在时,玩家就会对于不满进行放大。
从心理学角度解释[12]:人总会对不好的事情记忆深刻。就像每次玩炉石游戏时,我们总记得今天哪场对局对面特别胡,要啥有啥,自己要啥没啥!但是往往比较顺的对局很快就抛之脑后了。
小小结论
1、匹配的参考因素是浮动的,实际算法很复杂以至于上文的演算与实际情况有出入;
2、炉石匹配速度太快是产生匹配差异性大的主要因素。
3、炉石匹配机制不会针对玩家,匹配机制只是算法,不是AI(Artificial Intelligence), 没有以貌取人。
题来了:匹配机制如何优化?
官方对于炉石匹配系统的回应是:你的评分是匹配系统收到的唯一输入变量。该系统不知道你的卡组,也不知道你和你对手刚才使用的卡组,或者其他任何东西,它只知道你的评分。当然,我们不能认为官方的就是唯一标准,但经过深思熟虑后,冷静下来后还是会理性的看待这一问题,毕竟炉石传说只是一款游戏,我们需要的是它带给我的快乐而不是惆怅!
一、提高匹配时间,让更多相近对手能碰上
如果匹配时间达到30秒左右的话,个人觉得这种差距较大的匹配基本就杜绝了, 但是更大的问题就接踵而至了!过长的匹配时间会让游戏玩家的体验感大大降低,这也不是快速游戏所期望看到的结果。我们常常忽略匹配时间的高效性,因为我们已经适应这种快速游戏的节奏。
因此我们现在普遍玩家的现状就是:游戏速率越来越高效,生活节奏越来越拖沓。最后也希望我们每一个人都理性看待炉石以及其他游戏,使炉石变成我们娱乐消遣、放松压力的一部分。
基于官方回应最近匹配机制的问题[13],我大胆预测这一次的改动肯定会增加玩家的匹配的时间,关于胜负加分的问题改善不会太大。
二、增加不同分段的数据隔离手段
根据官方蓝贴的说法,目前暴雪决定在7月份开始将会修改目前的匹配规则,除非真的输了非常多把,否贼传说玩家将会更少匹配到非传说玩家。这就是强行使得不同分段的玩家进行了数据隔离,虽然没有根本上解决匹配算法的纰漏,但至少对于上分的选手来说,体验上会好很多。
三、更多脑洞机制?
虽然炉石无法轻易去更改匹配机制,但是Box君还是有很多比较大开脑洞的想法,例如在天梯中增加BP的手段、或者在匹配前给自己添加卡组风格标签(娱乐玩家、上分玩家)便于让系统匹配同一风格对手、又或者直接让天梯分段再细分,使得MMR的分数更加接近。
不知道大家有啥好建议,不妨大开脑洞给Box君留言分享一下吧!
相关参考资料:(仅供细节玩家查证)
[1] ELO详解——维基百科
[2] 天梯匹配规则ELO——维基百科
[3] 从ELO rating system 谈到层次分析法——DataLab
[4] 天梯匹配算法思路——yxriyin的csdn博客
[5] 炉石传说人口普查:6月国服传说共有15203人——NGA
[6] 炉石传说配对机制揭晓 炉石传说匹配机制详解——蓝贴
[7] 这匹配机制为什么老是针对我——暴雪官方论坛
[8] 大家怎么看,炉石的匹配机制——贴吧
[9] 设计师承认暗中更改了天梯中的匹配机制——推特
[10]姜神操刀奇数贼,我疯起来自己都害怕——炉石盒子
[11]韧劲十足的奇数骑,实战攻破狗贼防守的传说之门——炉石盒子
[12]在心理学上怎么解释,人们总是对不好的事情记忆深刻——贴吧
[13] 蓝贴:即将修复当前天梯错误的匹配规则——蓝贴
[1] ELO详解——维基百科
[2] 天梯匹配规则ELO——维基百科
[3] 从ELO rating system 谈到层次分析法——DataLab
[4] 天梯匹配算法思路——yxriyin的csdn博客
[5] 炉石传说人口普查:6月国服传说共有15203人——NGA
[6] 炉石传说配对机制揭晓 炉石传说匹配机制详解——蓝贴
[7] 这匹配机制为什么老是针对我——暴雪官方论坛
[8] 大家怎么看,炉石的匹配机制——贴吧
[9] 设计师承认暗中更改了天梯中的匹配机制——推特
[10]姜神操刀奇数贼,我疯起来自己都害怕——炉石盒子
[11]韧劲十足的奇数骑,实战攻破狗贼防守的传说之门——炉石盒子
[12]在心理学上怎么解释,人们总是对不好的事情记忆深刻——贴吧
[13] 蓝贴:即将修复当前天梯错误的匹配规则——蓝贴返回搜狐,查看更多