勿于浮沙筑高台 2019-06-25
点击上方关注,All in AI中国谷歌大脑团队的研究人员开源Google Research Football,这是一个利用强化学习教授AI代理人如何掌握世界上最受欢迎的运动的新环境。
足球(美国足球)是迄今为止世界上最受欢迎的运动。全球拥有超过40亿球迷,足球已被证明可以超越世代,超越了地缘政治竞争,甚至超越了战争冲突。这种热情已转移到视频游戏领域,其中像FIFA这样的游戏经常被列为全球最受欢迎的视频游戏之一。尽管它很受欢迎,但足球是已经证明具有人工智能(AI)技术的游戏之一。像FIFA这样的环境的复杂性经常给AI算法带来噩梦。最近,Google Brain团队的研究人员开放了Google Research Football,这是一个利用强化学习教授AI代理如何掌握世界上最受欢迎的运动的新环境。Google Research Football背后的原则在随附发布的研究论文中进行了概述。
快速浏览一下足球的游戏动态,就会发现AI代理面临明显的挑战。该游戏需要11名球员的协调行动,以评估对方球队中另外11名球员的行动。这些策略会随着游戏的进行而不断变化,规则也并不完全确定。此外,规则/战略的丰富性和复杂性,如进球、助攻、角球、黄牌和红牌、越位、手球、点球和替换都会让大多数铁杆球迷感到困惑,所以想象一下在AI算法中对这些球迷进行建模。毫不奇怪,传统的监督学习技术在应用于足球环境时往往不足。但是,如果AI代理人可以通过简单的比赛来学习踢足球呢?这就是Google Brain团队遵循的策略。
足球强化学习
将强化学习应用于足球环境的想法似乎很直观。毕竟,强化学习已经成为人工智能的一些最大突破,从创建AlphaGo到复杂的多人游戏环境(如Dota2或Quake III)中超越人类。强化学习提供了一种模型,其中AI代理可以通过反复试验而不是预先定义的训练数据集来掌握环境规则。一般来说,游戏为强化学习代理提供了一个良好的环境,因为他们以可重复的方式测试新想法,因此将这些原则应用于足球的想法似乎是直观的。然而,为足球创造强化学习远非微不足道,它带来了一系列非常独特的挑战:
这些是足球设法逃避大多数AI算法的一些关键原因。 Google Brain团队通过最先进的强化学习模式平衡了这些挑战,以非常独特的方式掌握足球。
谷歌研究足球
Google Research Football项目是一个强化学习环境,球员通过简单的游戏,代理人可以学习踢足球。该平台的当前版本基于三个基本组件:
足球引擎
足球引擎是基于流行的Gameplay Football环境的高级足球模拟。该引擎模拟一个完整的足球比赛,它接受来自两支球队的输入动作,其中包括最常见的动作,例如进球、犯规、角球、点球或越位。
从强化学习的角度来看,足球引擎包括一系列值得强调的相关属性:
状态和观察:足球引擎将游戏建模为状态和观察的组合。在该上下文中,状态被定义为在执行操作之后由环境返回的完整数据集。另一方面,观察被定义为作为控制算法的输入提供的状态的任何变换。
当前版本的Football Engine是用C ++编写的,允许它在现成的机器上运行,无论是GPU还是没有基于GPU的渲染。这使其在单个六核机器上达到每天大约2500万步的性能。
足球基准
足球引擎为研究人员提供了基本的构建模块,可以尝试掌握足球的新思路。但是,我们仍然需要一个完善的机制来客观地评估这些想法的可行性。 Football Benchmark根据预定义的任务集评估不同的策略。从功能上讲,这些基准的目标是针对固定的基于规则的对手进行足球的“标准”游戏,该对手是为此目的而手工设计的。目前版本的Football Benchmark提供三个版本:足球简单基准、足球中等基准和足球难度基准,它们只是对手的实力不同。
Google Brain团队使用两种先进的强化学习算法测试了足球基准:DQN和IMPALA。您可以在下面看到两种不同奖励模式(评分和检查点)的比较。我们可以看到增加难度水平需要模型使用更多步骤。
足球学院
足球引擎允许我们模拟完整的足球比赛,而足球基准允许我们评估不同的强化学习模型以应对既定的挑战。最后一步可能是学习如何为足球基准训练强化学习代理。这就是足球学院的作用,这是一系列不同难度的场景,其主要目标是让研究人员快速开始新思路,并对其进行迭代。足球学院包括各种各样的设置,代理人必须学习如何在一个空球上得分,如何向守门员跑,如何在球员之间快速传球以击败防守线,或者如何执行快速反击。例如,下面我们可以看到在足球学院的不同场景中评估IMPALA算法的结果。
Google Research的足球环境是迄今为止最雄心勃勃的强化学习项目之一。这个堆栈将允许人工智能研究人员在现有的最具挑战性的强化学习环境和与人类强烈情感相关的环境中评估想法。
简介:Jesus Rodriguez是一位技术专家、执行投资者和创业顾问。作为一名软件科学家,Jesus是一位国际公认的演讲者和作者,他的贡献包括在行业会议上发表了数百篇文章和演讲。