游戏
人工智能的下一目标,是去玩一玩《星际争霸 2》
为了安慰自己,我准备回去野电脑一百盘隐刀。
在今年 AlphaGo 在围棋上战胜韩国选手李世石之后,当时就有消息称,AlphaGo,或者说其背后所代表的的人工智能,下一个目标是《星际争霸 2》。
如今,这个消息终于得到了正式的确认:暴雪娱乐宣布和 Google 旗下人工智能公司 DeepMind 合作,后者将着手开发一款会玩《星际争霸 2》的人工智能。DeepMind 正是那个开发出了 AlphaGo 的公司,如今,他们面临的挑战比教人工智能下围棋难得多。
《星际争霸》系列游戏作为闻名世界的即时战略游戏,以其多变的战术和复杂的操作闻名,同时考验选手的大局判断以及随机应变能力。玩家需要在游戏里收集资源,合理分配这些资源在不同的兵种上,最后针对性地组成一支大军,战胜对手。
而与围棋最大不同点之一,《星际争霸》这类的游戏是一种不完全信息的博弈:不像围棋,人类和机器都可以纵览棋盘上的每一个位置,知道之前和当下棋手所下的棋子的位置;在游戏中,你对“对手在干什么”这个信息获知非常有限。这一方面,是因为战争迷雾的存在,遮蔽了一些视野;另一方面是因为一些欺骗性战术的存在,比如狡猾的对手可能故意取消或者多造一些出兵建筑,来混淆视听。
“《星际争霸》对于现在的人工智能研究来说,是一种非常有意思的测试环境,因为它提供了一座通往现实混乱世界的桥梁。”Oriol Vinyals 说。Oriol Vinyals 从 15 岁开始就开始玩《星际争霸》,他曾经是西班牙的一位顶级选手,而现在,他是一位 DeepMind 的人工智能研究科学家。
Oriol Vinyals 的意思是,《星际争霸》中的世界和现实世界存在诸多相似之处:不确定性、混乱、欺骗,而生活在这个环境里的人(或者机器),需要有记忆并制定长远的计划;而如果人工智能可以在《星际争霸》中取得成绩,那么通过相似的手段,它就可以胜任一些现实世界的任务。
目前,《星际争霸》这一类的即时战略游戏存在着自己 AI,并且分为各种等级。高级的 AI 早已超越了人类。熟悉《星际争霸》的人可能都知道那个著名的悍马 2000 型 AI 的视频,AI 以极其精妙的操作让笨重的坦克上下运输机,全歼了人类选手一大波部队而毫发无伤。
类似的视频还有很多,都是 AI 如何完虐人类选手。
然而,这种 AI 并不是 DeepMind 要的那种 AI:和暴雪内置在游戏中的 AI 一样,这类 AI 的实现手段带有一些作弊性质:人工智能会获得一些人类选手不可能获得的额外信息,并进行一些从规则或者逻辑上不允许的操作:比如电脑可以控制单位,向其视野外的某个单位发起攻击,因为毕竟对于电脑来说,它没有“视野”,它不是去识别某个单位,而是通过内部数据接口,直接了解某个单位的位置、大小和数量;同时,电脑可以几乎同时向无数个单位发送指令,这也就让人类选手的操作显得毫无意义。
DeepMind 想要那种 AI 是一个真真正正的“人”:首先,通过固定视野大小的镜头画面,识别出游戏中的建筑、兵种和地形,然后进行一步一步的操作,这其中会限制电脑的 APM,也就是每分钟动作数,来防止其做出一些人类无法完成的动作。
首先的难关就是如何辨别画面:从 DeepMind 放出的一段视频来看,他们用一些简单的图形组成的图层,分别记录了游戏画面各种不同类型的数据:比如所有单位生命值、类型、玩家所属等等,然后再通过一些接口传输给 AI 供其分析。暴雪也将为开发者提供《星际争霸 2》游戏的录像,以供他们研究学习。
至于如果让电脑学习策略、分析和战术战略能力,现在说这个问题或许还有些早。在各个玩家社区,这也是争论的焦点:一些玩家认为电脑可以通过无时无刻的侦查,加上计算晶矿和气矿使用消耗量,来判断对手的战术;而另一些玩家觉得电脑无法识别战术欺骗,也缺乏足够的应变能力——反对者又提出,人工智能可以通过不断学习,来达到这一点,就如同真正的人类一样。
就目前的情况来看,很难下判断人工智能是否能够胜任《星际争霸》这款游戏。暴雪宣布,将在明年第一季度推出一款专门为人工智能开发者设计的《星际争霸 2》游戏 Mod,方便其调取数据、设计和测试。而这种人工智能何时能完成、何时能打败人类,都是不可预知的事情,或许在你我的有生之年都无法看到这一天。
不过,曾经人们也觉得,电脑下围棋不可能下得过人类。
原文链接 (已下线): https://www.qdaily.com/articles/34179.html
Wayback 快照: http://web.archive.org/web/20190623180055/https://www.qdaily.com/articles/34179.html
原始截图: http://ww3.sinaimg.cn/large/007d5XDply1g3xd4jyhajj30u042qu0x