游戏业之怪现象：高分低能、低分手游高收入如何解？

GameLook 2020-05-21

和电影相同，游戏是一门综合艺术，又具有典型的工业化特征，其复杂性也使得人们需要一套适宜的评价体系，让专业或主流的声音，帮助预先判断品质。

近几年来，游戏厂商越来越感受到，游戏评分太重要了，特别是TapTap、Steam流行后，玩游戏先看评分已成定势。开服评分雪崩，也几乎成为每个厂商都经历过的噩梦和必修课，也促成当下普遍的“讨好型”“道歉型”运营出现。

但是，好评分与差评分，是否又与游戏收入正相关？其实又不尽然，前段时间，GameLook报道了一款AVG手游《圣歌德嘉的晚钟》，因创意独特、质量上乘，在TapTap上玩家毫不吝啬溢美之词，给出了9.9分的高分。原本皆大欢喜，但业内某厂商高管不无担忧地表示：

“一看9.9的评分，心里就为他们捏了一把汗。TapTap上高评分的，基本都死了。中等评分左右才有机会活下去。好残酷。”

这一说法略有绝对，但又并非毫无道理，一定程度反映了当下游戏评分与收入的“倒挂”现象。

高分低能、低分高能，游戏评分与收入倒挂

判别“赚大钱”手游最权威的指标，是App Store畅销榜，以5月11日畅销榜为准，GameLook统计了TOP50产品的评分数据。

App Store评分采取满分5分制，50款游戏评分最高4.9分、最低3分，平均4.3分，这表示App Store评分与收入呈现正相关。

不过，App Store评分哪都好，最大的问题是“没人信”。

很多玩家和媒体认为，App Store刷评论问题过于严重，尽管苹果不断更新算法规则，但外界一直认为其未有太多的规制手段，因此玩家对于App Store评分真实性信任度不高。

TapTap评分以真实性著称，联合创始人张乾也曾表示玩家、开发者与TapTap之间的信任感是“最宝贵的”，所以不会应厂商要求改评分。那么中国市场最赚钱的50款产品，在TapTap真实的评分系统是什么情况？

TapTap采取满分10分制，排除TOP50内4款未上架TapTap的产品，46款游戏TapTap评分最高8.6分、最低1.6分，平均5.9分，刚好没及格。

换言之，在玩家眼中好的游戏不赚钱，赚钱的游戏又没那么好，是为“高分低能”“低分高能”。

为什么会这样？

我们或许可以用“幸存者偏差”来解释。畅销的基础是人气，而高人气的游戏，同比例放大往往不满的玩家也多，加上评分往往被玩家视作投诉的方式，加剧了不理性差评的现象，使得评分失真。根据“沉默的大多数”理论，好评的玩家会远远小于差评的玩家，最终导致畅销产品评分不高。这是从旁观者角度看玩家，所发散的观点，用以解释“低分缘何高能”。

当然，今天无论是Steam还是TapTap，都启动了评分保护机制，在发生因不可抗力事故引发的差评狂潮时，可以在一定时间内锁定游戏评分。

差评打击效果明显，好评其实没那么有用

不只是玩家，游戏厂商、渠道同样有发言权。

2017年腾讯全球合作伙伴大会分论坛上，圆桌环节GameLook曾与莉莉丝创始人兼CEO王信文、祖龙创始人兼CEO李青，以及腾讯应用宝游戏负责人于小雨等业内人士讨论过游戏评分的问题。

王信文坦陈，游戏评分确实会影响买量下载转化率，莉莉丝经验之谈是：“（App Store）4分以上比较好，但4.2分、4.5分、4.8分之间没有本质影响，3.5分到4分之间会使买量（下载转化率）有一定下降，3.5分以下会有显著下降。”

App Store评分系统有一个潜在的特质，它显示的评分是最新版本的评分，而Google Play、TapTap均显示历史版本的累积评分。这使得App Store评分相对好处理，即便差评爆发，厂商也可以爆肝发布一个优化的新版，只要质量足够高，评分就会回升。

也就是说，App Store确实有厂商“人为干预”的部分，但这部分同样是在苹果规则之内进行。TapTap尽管相对回升困难，但依据玩家意见修改后，评分回升的可能性也很高，包括《明日方舟》《战双帕米什》《山海镜花》等产品，均有评分回升经历。

总体来说，差的评分对游戏表现的确有负面影响，但好的评分正面影响又没那么强。

李青也认同，游戏评分有一个门槛，过了之后，“对于买量的影响就没有那么高了”。而二者都提到了一个游戏受众的问题，与电影不同，高评分的电影意味所有观众都有可能买票走进影院，但手残的玩家绝不会入坑吃鸡、喜欢刺激的玩家总是拒绝模拟经营。换言之，游戏玩家相互之间是割裂的。

王信文和李青，都以各自旗下某款真实产品遭遇为例，探讨了评分和收入的倒挂现象，如李青所说“我们推了一款产品，分巨高，但没多少人玩，因为用户群太窄”。

回到开头某厂商高管的说法，其所担忧的，正是《圣歌德嘉的晚钟》评分超高背后折射的受众规模大小。

测试前置缓解倒挂，高评分更需足量用户支撑

有趣的是，游戏厂商大多认可App Store与TapTap评分的真实性，尽管就目前来看，它们所体现的都是“部分的真实”，但反过来说，“全部的真实”又怎么能够通过单一平台评分实现呢？不过李青觉得，得益市场和媒体的发展，各平台评分会逐步接近100%真实的玩家想法。

而在于小雨看来，“离开渠道的评分都是耍流氓”，无论分的高低，始终要配合流量和用户运营才最重要。

王信文、李青和于小雨提供了一种解决“高分低能”“低分高能”怪诞现象的设想，即辩证看待玩家评分，通过足量的用户群去支撑玩家评分的价值。

我们可以讨论海外厂商的做法，以“行业偶像”Supercell为例，它的解决手段是做好前置测试，将完整的游戏，先行在新西兰等小市场进行软启动，模拟大市场情况，最大限度汲取玩家意见协助优化。

Supercell做法关键点在于游戏的“完整”、以及目标市场的参照市场，与之相对，国内游戏测试时产品往往不是完整的，这个“完整”的定义并非玩法、美术、剧情完成度，而是是否具备商业变现系统。

因而我们能够看到，许多国产游戏，甚至包括商业化大作，虽然测试期分数高到不正常，动辄9点几，但一旦公测加入内购或广告变现，评分立刻跳水。剥离商业系统与完整版本之间体验的巨大反差，让畅销游戏承担了过多的骂名。

然而，国内市场环境杜绝了完整游戏测试的可能性，但海外市场打开了另一扇窗。

以莉莉丝为例，同样对于测试十分看重，甚至采取和超休闲游戏一样的做法，将测试前置到前所未有的创意阶段，如发行负责人张子龙就曾透露，从《万国觉醒》开始莉莉丝就在Demo阶段开启画风吸量测试，过程花了几个月。

同时和Supercell一样，莉莉丝在软启动时期，便十分重视“打透样板国家”，针对主流的中、美、日、韩等市场选择10余个样板后，还要至少测两个月，找对目标用户，将样板国家数据挖干净，最终确定游戏上线后的用户规模。

相对的，经常发行独立游戏的雷霆则是另一种“小而美”的典范，通过在发行上保持足够的克制，而非全球性大范围的轰炸，达到目标效果。当然，这也建立在提前预判独立游戏小众，找准核心用户的基础之上。

结语

“高分低能”“低分高能”是一种不正常的倒挂现象，它产生原因很复杂，有自媒体的发达、玩家审美上升、幸存者偏差等等。在现有环境下，彻底告别该现象可能性很小，但减少其影响和发生又并非不可能，更完善的测试，目前就不失为一种有效的方案。

归根结底，没有足够的用户群支撑，评分再高游戏长线运营也受到限制，反之高评分虽然作用没有想象的那么重要，但一旦低于一个节点，对于产品的打击性同样致命。如何拿捏平衡，考验的不只是厂商研发，更有对核心用户的定位和理解能力。

来源：GameLook
地址：http://www.gamelook.com.cn/2020/05/385701

微信公众号

微博

头条号

百家号

网易号

知乎号

游戏业之怪现象：高分低能、低分手游高收入如何解？

微信公众号

微博

头条号