人工智能研究的萌芽年代,游戏是怎么成为开荒利器的

作者:天美妙妙屋 2021-09-29 2.9k
首发知乎“天美妙妙屋”
https://zhuanlan.zhihu.com/p/414832131

<天美妙妙屋>是天美游戏工作室群内部由游戏策划、运营和热爱游戏的朋友组成的非官方组织,都是有感而发的游戏及产业研究,并不构成游戏开发及投资建议。

19世纪初,英国数学家查尔斯·巴贝奇发明了一种叫做「分析机」(Analytical Engine)的可编程设备,尽管最终没有建造完成,但它的设计逻辑、输入和输出概念、支持的程序语句已经具备了电子通用计算机的特性。也难怪被称为世界上第一个程序员的爱达·勒芙蕾丝预言,这台机器可以创作出具有无限宽度和深度的科学乐章。

一个多世纪后的1956年,学者们就在乐章上写下了浓重一笔,他们在达特茅斯学院敲定了「人工智能」的名字和研究方向,为制造、农业和教育等领域的科技革命和产业变革带来了新的驱动力。

不过一个有趣的事实是,虽然很多人习惯用「高精尖内容」给这个概念做包装,但人工智能在计算机领域的最早实践,有一条路线却是通过特别接地气的电子游戏来实现的,就连大名鼎鼎的「人工智能之父」艾伦·图灵也有参与。

所以本文的基调并不是强行去讲晦涩难懂的技术,还是让我们从一些不太有人提及的故事开始吧。

老古董上的人工智能

可能众所周知的是,上世纪40年代的计算机数量非常少,很大程度上只能在大学、大型企业和国家政府的研究实验室中看到,而且这些设备对应的功能非常有限,不仅很难重新编程,大多数也缺乏执行存储程序的能力。

什么,你说要是想换个功能怎么办?那就把机器给拆了重新造……

因此,即使是学者觉得游戏对工作有帮助,也几乎没什么实践的机会。

1940年代由英国工程师设计的计算机「巨像」,作用纯粹是破解纳粹的密码

直到又过了将近10年时间,计算机可以执行的任务开始变得多样起来,围绕人工智能进行更多实践,让公众认识到这些设备的巨大潜力,才成为当时很多研究人员的目标。可想而知,一旦某件事情要面对公众来做文章,游戏就变成了最合适的宣传载体。

1950年,加拿大国家博览会上出现了一台名为《大脑伯蒂》(Bertie the Brain)的井字棋游戏,机器有四米高,垂直的大屏幕由电灯组成。玩法很简单,人类和计算机相继在九宫布局的棋盘上行棋,后者会有一个短暂思考的过程,然后根据当前的局面落子。因为最高难度下人类很难取胜,它有时会被认为是人工智能最早在大众领域的应用。

艺人丹尼·凯耶在加拿大国家博览会上庆祝战胜「大脑伯蒂」

最初造这台机器的目的,是加拿大工程师约瑟夫·凯特(Josef Kates)为了宣传他发明的「加法管」(Additron tube),以寻找潜在的投资人。这是一种比传统真空管更轻的电子管(虽然也更耗电),原本打算应用于多伦多大学的电子计算机(UTEC)上,但因为申请专利的过程太漫长,到1957年被美国批准时性能更强劲的晶体管都开始普及了,最终不了了之。

所以虽然《大脑伯蒂》在展出期间很受欢迎,很多人排长队都要玩上一把,它和喜剧演员丹尼·凯耶(Danny Kaye)的合照甚至还登上了著名杂志的专题,但它还是失去了进一步推广的机会,展后就被拆除了。凯特此后也没有选择在人工智能领域深造,而是跑去设计了世界上第一个自动交通信号系统。

不过所谓西边不亮东边亮,恰好也是在1950年,英国物理学家克里斯多福·斯特雷奇(Christopher Strachey)萌生了一个基于人工智能创造棋类游戏的想法。

物质基础是,他有机会接触到英国国家物理实验室的试验计算机(Pilot ACE Computer);而理论基础,则来自《企鹅科学新闻》(Penguin Science News)上一篇同行的文章:《井字棋理论》(A Theory of Chess and Naughts and Crosses)。

斯特雷奇在1951年5月尝试制作了《西洋跳棋》的最初版本,并于7月首次在ACE上运行,但因为程序错误而以失败告终。

幸运的是,没过几天他就在曼彻斯特大学参观Ferranti Mark 1期间遇到了图灵,后者才刚刚写完这台机器的《程序员手册》。图灵听闻其遭遇后,怂恿他在Ferranti Mark 1上再干一次,没想到这回倒是成功了。

计算机Ferranti Mark 1和《西洋跳棋》

斯特雷奇《西洋跳棋》的重要性远超出游戏行业的范畴,它或许是第一个以科研为目的展示的人工智能程序。

值得一提的是,人工智能全面进入大众视野正是以此为契机的。因为在1952年7月做完游戏后,斯特雷奇就拿着该案例在多伦多的某个会议上讲了一课,让当时还在IBM工作的电气工程师亚瑟·塞缪尔(Arthur Samuel)备受鼓舞。

塞缪尔和其它学者有所不同,很擅长把复杂的技术以容易理解的方式讲出来,他认为教计算机玩游戏有助于研究具有普遍意义的开发策略,其中跳棋非常适合,规则简单又有策略性。所以在1952年底,塞缪尔在IBM的第一台商用计算机701上创造了一个初版的跳棋游戏。

正在测试跳棋程序的塞缪尔

由计算机扮演的棋手被他赋予了一种能力,可以综合考虑每边棋子的数量以及棋子与「国王」之间的距离。它在接下来的几年中又得到了进化,到1955年时已经变得能够分析每局的过程并从失败中成长。由于该程序一度登上美国国家电视台的节目,让民众看到了硬件和编程技术的进步,瞬间引发轰动,IBM的股票受此影响一夜之间涨了15个百分点。

塞缪尔后来又在1959年的文档中推广了「机器学习」的说法,比起《大脑伯蒂》和《西洋跳棋》死板的程序行为表现,他的跳棋能够自我学习,可以说是真正意义上现代人工智能概念的鼻祖之一。

但必须得承认的是,那个年代机器学习的速度并不快,在1966年举行的世界跳棋锦标赛上,该程序输给了两名真正的专业选手,而从过去十多年中的战绩来看,它也只达到了业余棋手的水平。

不过更重要的是,游戏事实上成为了最早辅助人工智能应用和开启民众对计算机认知的工具之一,自此之后一直被认为是评价人工智能行业进展的标准,如今也反馈到实体经济和社会工程的援助上。

电子游戏的魔力

游戏中的人工智能现在发展到什么程度了?其实可以从2016年育碧成立的研究分部 「La Forge」看出一点端倪。这是一个由开发人员和院校学者组成的团队,着手领域主要是人工智能和机器学习,并不直接参与游戏开发,而是利用游戏的现成资源来补足研究中的空缺。

例如测试自动驾驶系统用真实场地的成本太高,那就在已经构建好的开放世界里跑上几圈,游戏里车辆和NPC的人工智能刚好可以作为干扰项拿来应用。

个人印象最深的,是2020年谷歌DeepMind、布朗大学和英伟达组织的一场研讨会,方向是讨论强化学习(Reinforcement Learning)如何在真实环境下运用。

DeepMind曾经用人工智能预测蛋白质结构(AlphaFold)和打《星际争霸2》(AlphaStar)

笼统的看,强化学习是一种基于「奖励期望行为」和「惩罚不期望行为」的机器学习训练方法。La Forge当时提到了一个主题,正是利用强化学习来辅助地图导航。

因为以往游戏场景的复杂度不高,开发者用导航网格(NavMesh)应付得过来,但现在的游戏里充满了钩爪、喷气背包、瞬间移动和二段跳这些东西,用NavMesh来做会变得非常麻烦,需要手动指定每个单独的链接,所以作为一种替代方法,可以让系统来处理导航操作。

传统导航网格的逻辑

而他们抛出的解决方案如下:


作为输入,代理将接收到一个本地世界视图,其中包含2D深度图、3D占用图,当前目标位置以及其它一些基本状态(如当前速度和加速度),然后这些输入通过前馈、卷积神经网络和LSTM(长短期记忆)的处理后生成一些预测路线,输出到策略和价值网络,接着用Soft-Actor Critic(一种算法,可以直接应用于真实的机器人)进行训练。这种方法在育碧蒙特利尔开发的《超猎都市》中执行得非常好,在点对点的导航中至少有90%的准确率。

实际生活中,我们知道地图导航在「大路」上已经比较精确了,但要是你走个小路、上个天桥或是往楼里一钻,它就未必那么好用了。而除了游戏之外,La Forge也在测试强化学习的导航方法如何尽可能泛用,它在实际生活中应该也是很有潜力的。

育碧La Forge的深度强化学习导航示例

游戏结合人工智能和机器学习的例子还有不少,以Metacritic媒体均分90、拿过十几个奖项的模拟游戏《黑与白》为例,它的核心玩法恰恰是基于玩家行为,来影响人工智能的成长过程。

具体来说,你扮演一位神,通过点击屏幕与人类和生物进行互动。要是某只生物做了玩家不愿意看到的事情,那就打它一巴掌,反之则摸一摸。久而久之这种生物会记住你对各种行为的反应,逐渐改变行为,执行更复杂的功能。几乎每个行动都会影响游戏环境,你的追随者可能建立明亮鲜艳的善神庙宇,也可能把神殿装潢得令人生畏,以彰显玩家的邪恶。

开发商狮头工作室引入了美国哲学家迈克·布拉特曼(Michael Bratman)的理论,让生物行为围绕「信念-欲望-意图」的模型呈现。

从开发的层面来看,各种世界对象的存储数据作为「信念」,「欲望」是生物想要实现的目标,用简化的感知器来表达。最后结合达成目标所需的行为树,实现复杂的生物「意图」。游戏设计师彼得·莫力纽(Peter Molyneux)甚至一度想拿这套系统通过图灵测试,虽然一直没有成功。

黑与白2

国内也有开发团队进行过类似的尝试,像是笔者稍有了解的天美工作室,前几年做了款名叫《疯狂贪吃蛇》的游戏,其中就包含一种基于生物进化基本原理的人工智能系统(中国专利号CN201710261467.5)。

大体逻辑是,在游玩过程中,玩家行为会触发一个生物种群进化的概率事件,类似于自然界中优胜劣汰的淘汰机制 —— 孱弱的敌方个体被消灭后,存活下来的生物和后代将越来越强。由于不需要使用复杂的状态机,无需枚举大量事件逻辑,开发工作量会大幅降低。

可以去专利局网站查询专利号CN201710261467.5

现在一般游戏中所说的人工智能,在没有加入机器学习前,是通过设定规则和枚举行为两种方法实现的。所谓设定规则就是明确的一系列规则,给相关对象赋值,智能对象就会按照规则限制的范围开始行动,这些个体的行为基本都是可预测的。

而枚举行为就是把对象所有可能的行为都设想到,有点类似于穷举法,人工设置好所有响应,由此各个行为分支就组成了一个树形结构,或者使用状态机来维护各个行为之间的触发条件和切换逻辑。稍微想想也知道工作量非常大,要是考虑得不够全面,玩家摸清楚规律便会发现是固定的机器行为。

前文提到的人工智能先驱《大脑伯蒂》和《西洋跳棋》可能就存在这些问题,直到塞缪尔将机器学习融入游戏后才往前跨出一步,La Forge、狮头和天美以及更多的游戏工作室在此基础上继续深化,使得相关内容更亲民的同时,也有望援助算法研究,让一部分研究成果落地到实体经济和其它的产业环境。

其实无论是人工智能本身,还是一部分源自游戏的机器学习成果,说它们反哺实体经济会让人觉得很「虚」。微软亚洲研究院提到的一个观点可能讲出了原因,因为这些研究成果贴近经济学家所说的「通用技术」,就和蒸汽机、内燃机和电力一样。在我看来,由于和什么领域都能联系起来,再加上有很多东西太术语化,比较前沿,不容易触及大众的实感。

但稍微搜一下就能找到不少应用案例。比如La Forge的执行官伊夫·雅基耶(Yves Jacquier)在2019年的GDC上提到,有些游戏厂商收集了很多不同语言发音的嘴唇动画数据,通过人工智能可以让虚拟角色自动对口型。同理也可以把大量动捕数据保存,利用人工智能自动匹配到某些场合,减少工作量,这些研究无疑可以跨行业去援助电影制作甚至机器人的设计。

用人工智能对口型在《刺客信条 奥德赛》里也有应用

又比如,天美的生物进化专利也只是机器学习里一种很特化的应用,还有更大的畅想空间。国网江苏省电力在2020年的一份期刊里提到—— 为了保证新一轮电改的顺利进行,深度学习能从样本数据中挖掘出历史电价、社会因素等内外在因素与电价间的关系,可以考虑用这项技术去预测电价,帮助专家制定对策,这就和民生以及实体经济的发展强相关了。

另外IBM的Watson系统还给辅助诊疗提供了解决方案,可以快速收集病症和病史,在人工智能的帮助下,通过医学图谱和模型实现诊断决策,判断患者得了什么病。当然这只是给医生提供参考意见,把病症的范围缩小以加快确诊时间,目的并不是取代人工。

IBM Watson

我国对人工智能的应用也是比较认可的,前几年国务院就印发过通知,认为它在引导下可以给社会建设带来新的机遇。为了加快建设创新型国家和世界科技强国,按照党中央部署要求制定了一系列规划,到2025年时希望我国人工智能的基础理论实现重大突破。

其中也有和游戏相关的条目,例如实施全民智能教育项目,在中小学阶段设置人工智能相关课程,鼓励社会力量参与寓教于乐的编程教学软件、游戏的开发和推广。

具体到数据,中国计算机科学家、中南大学教授蔡自兴表示,2018年中国人工智能产业产值预估达230亿元人民币,并为实体经济带来了1000多亿元的增长。这和调研机构艾瑞咨询的预测相符:到2022年,我国人工智能赋能实体经济市场规模将达到1573亿人民币。

如此来看,在人工智能研究的萌芽年代,游戏是作为开荒利器而存在的,如今它仍然是一件趁手的工具,爱达·勒芙蕾丝的预言现在还远没有走到终点。


原文:https://zhuanlan.zhihu.com/p/414832131

相关推荐

最新评论
暂无评论
参与评论

Facebook游戏出海峰会
推广
商务合作 查看更多

编辑推荐 查看更多