陆军中的AI与自主机器人,是这样的

liujainq 2020-08-04

每每说起AI与机器人,很多人脑海中首先浮现的往往是那些“后启示录时代”下恐怖、且具有强大超智能的机器,它们横行无忌、甚至占领了整个世界乃至宇宙。电影《终结者》可以说是人们对于AI恐惧之情的典型具象体现,其中的天网(Skynet)——以计算机为基础的人工智能防御系统,被影片称为“基于人工神经网络的集体意识与人工通用型超智能系统”。但目前看来,AI似乎并不像科幻小说中所描述的那样充满戾气。相反,AI正在执行诸多繁琐且传统上只能以手动方式完成的任务,同时为我们带来从识别到对话、再到预测分析模式匹配的各类自主系统。

相较于科幻片里夸张的想象力与创造力,现实中的军事组织在AI领域的投资却尤为真实。以帮助人类更好地完成现有任务的角度,机器学习与AI的实现方式真没那么戏剧性。有趣的是,提升机器智能的过程,反而令人类得以更好地理解并控制周边的环境。

美国陆军研究实验室机动与机动性事务AI与机器学习应用性能管理负责人John Fossaceca最近在一场AI大会上(AI in Government)发表演讲,分享了“AI如何应对各类日常场景?”,同时也介绍了“美国陆军的自主机器人乃至其他机器的未来发展方向”。

陆军中的AI与自主机器人,是这样的

问:美国陆军目前如何运用AI技术?

John Fossaceca:陆军正在以多种方式使用AI技术,例如将其引入预测性维护当中。AI技术能够帮助我们预测,如何抢在汽车发生故障之前,替换或维修相关的零配件。做到了这一点,我们将节约下大量金钱并提高操作安全性。目前布拉德利战车等多种军用载具都在尝试这项功能。

陆军方面掌握着大量数据,而AI与机器学习技术普遍需要大规模数据支持。以Maven项目为例,此计划使用无人机发回的数据帮助分析人员自动完成某些军事工作。Maven项目中就使用到一系列标准化AI工具,例如谷歌的TensorFlow,当然也配合陆军内部构建的自定义工具。

陆军还在积极研究,使用AI技术增强自动驾驶汽车、电子战与信号情报、传感器融合以及增强现实等等。AI将通过联合全域指挥与控制(JAD-C2)等计划,提高战场上的态势感知能力,最终改善军方的决策制定水平。

AI在军队中的另一项重要作用在于,实现更好的人才管理。目前,陆军AI特遣队(AITF)就在主动使用AI技术,寻求成功作战所必需的能力与属性,并结合这些需求物色潜在的军事人才。

在作战能力发展司令部下辖的陆军研究实验室(ARL)中,AI已经成为一大主要研究领域。ARL可以算是陆军内部的研发中心,管理着多项AI相关计划。以名为“机动与机动性人工智能(AIMM)”的基本研究计划为例,其目标在于引导陆军思考如何为下一代战斗车辆(NGCV)在无需人为介入的前提下获得良好的越野能力。这些下一代智能车辆,能够根据特殊情况、环境条件做出推理,进而做出最佳行动决策,同时向士兵发出情况通报,以提高对战场的态势感知水平。ARL还拥有其他多项重要研究计划,并着力运用AI方法在其中推动创新,相信这一切都将给未来的陆军带来更强的作战能力。

将来,美国陆军将使用AI技术处理来自多个传感器的输入数据,借此准确描绘战场威胁,同时加快由陆军未来司令部领导的Convergence(融合)项目中的目标制定与目标决策过程。

问:采用人工智能/机器学习技术,陆军面临哪些挑战?

John Fossaceca:「商业AI」依赖于庞大的计算资源与海量数据,其中云计算资源能够及时向终端返回处理结果。但另一方面,「战地AI」则受限于边缘设备——计算机处理器相对轻量化,且在战场对抗环境下通信带宽可能较有限。

在陆军的实际应用中,我们通常得不到充足的训练数据,现有的数据往往已经损坏或者噪声过多。运营环境也趋于动态变化,有时会因道路、建筑物以及基础设施受损而变得混乱不堪。另外,我们需要面对来自多个来源的异类数据,某些数据甚至具有欺骗性或者已经受到对手的操纵。

目前的AI技术往往非常脆弱,甚至在理想的运营条件下也有可能发生崩溃。其推理能力也非常有限,特别是在实时推理方面表现不佳。部分已经部署的系统虽然不断强调其AI能力,但实际功能往往受限于硬编码规则,而缺乏从传感器及其他系统收集输入内容,并做出推断与推理的能力——更遑论提供增强型态势评估了。

相当一部分AI方法都依赖于“监督学习”(例如深度学习),这类技术会构建起庞大的模型,通常需要在超大规模计算基础设施之上,以“批处理”形式学习成上千万甚至上亿个参数。很明显,陆军需要的是能够摆脱这类束缚、真正拥有在线实时推理能力的解决方案。

最终我们发现,现有系统并不能真正自动运行,其仍需要人为介入、干预乃至手动控制。早在2018年,我们就开始尝试通过反馈进行学习,由人类观察者向智能代理提供正面或负面信号。通过这种方式,我们证明可以大幅缩短学习时间。我们将这项研究扩展并总结为“示范学习”,稍后我们会进一步讨论这个议题。

随着研究的深入,我们意识到需要一种与「智能代理」的自然交互方式。除了自然的对话与接触之外,由于AI缺少对世界的认知常识与“朴素推理”能力,很多问题随之浮出水面。我们则通过AIMM中的第二项工作——上下文感知决策制定——努力攻克这些挑战。

问:陆军如何为人工智能/机器学习项目提供数据支持?

John Fossaceca:陆军乃至整个国防部,都在开展大规模数据收集与标记工作,借此为AI算法准备可用的数据资源。例如,Maven项目中就使用到大量来自无人机的视频素材。有时候,我们也会根据保密级别,通过众包技术进行数据标记。其他举措还包括ARL的内部工作,例如从各个位置收集内部数据,并与研究合作伙伴一道整理并标记各类地形数据。ARL在马里兰州设有机器人研究合作园区(R2C2),在园区内收集数据并进行各类自主实验。

除了Maven项目之外,国防部还在运用先进工具进行情报分析。其中大部分项目致力于使用深度学习方法检测图像中的特定对象,而实现的前提,自然是对大量数据进行清洗、整理与标记。此外,项目还要求研究人员使用存储、算法工具包、计算资源、测试以及部署工具共同构建起AI管道。为此,项目团队往往需要开发出数据格式标准,以保证实验与测试场景之间保持一致,并为用户提供熟悉的环境。数据存储库本身也需要进行分类以供用户访问,同时保证其中的数据随附可用描述。为了在多个数据库之间实现信息访问标准化,军方做出一系列努力,旨在降低情报界使用AI成果的门槛。

问:陆军如何利用自动驾驶汽车实现机动性目标?

John Fossaceca:在陆军的机器人与自主系统(RAS)战略中,副总参谋长Daniel B. Allyn将军明确提到,“RAS的整合,将帮助未来作为联合部队重要组成部分的美国陆军,获得克敌制胜、控制地形、保护民众以及巩固利益的能力。RAS还将帮助未来的陆军部队得以与其他多个领域的战斗行动保持统一,将力量从陆地投射至海洋、太空以及网络等多个空间,共同维护联合部队的行动与作战灵活性。”

根据RAS战略的描述,“有效整合RAS,将提高美军维持高强度作战的能力,并使敌方无法做出有效反应。陆军必须加紧建立自己的RAS能力,这是一场与敌方比拼速度的RAS军备竞赛。一旦落后,敌方将采用一系列新策略破坏美国的军事优势,并借此获悉的美国军事体系劣势。”

为了实现RAS战略的愿景,自动驾驶车辆必须能够保障“机动自由”,同时降低士兵的伤亡风险。这就要求人类与机器之间实现自主协作。车辆将成为战场上的队友,而不再只是一种武器装备。这些“人机集成小队将帮助军方在情况不明的条件下探寻、适应、战斗并最终取胜。”

AI技术无疑是这些智能自主系统的关键驱动力之一。美国陆军还必须直面客观事实,即其对手也将使用自主系统。在自主水平不断升级的背景下,机器人自主系统将不再依赖于通信链路——因为干扰及传输容量的限制,通信链路在战场条件下几乎得不到任何保障。

从优先级角度出发,RAS战略要求在短期内改善态势感知水平,并帮助减轻士兵的体力负担。着眼于中期,“自主车辆行动”不仅有助于维持战场形势,同时也将为士兵提供掩护。最终从长远来看,自动驾驶汽车将获得执行先进战术的能力,进而“提高旅级战斗团队的能力”。

问:哪些独特的环境挑战,会影响到自动驾驶汽车与设备的研究工作?

John Fossaceca: 除了复杂的地形与非结构化环境之外,敌对方也有可能对陆军的作战环境带来不可预测的影响。陆军的研究,专门针对所谓“战术行为”,即自动驾驶汽车应该采用怎样的特定形式?自动驾驶汽车如何在两军对抗中夺取优势地位?自动驾驶汽车如何在不被敌军发现的情况下运行?陆军已经就此做出深入研究,并着力保证下一代作战车辆能够推理出所有潜在路线——甚至包括涉水路线。

问:ARL在无人驾驶汽车方面的研究,与民用行业的研究有何不同?

John Fossaceca:在陆军作战环境中,通常很难收到规模化、与军事相关且具有明确标记的数据,因此ARL一直高度关注AI算法,希望探索出一条对数据依赖性远低于传统监督方法的新道路。与此相匹配,陆军将针对场景分割等用例,开发「无监督方法」,希望实现对数据的自动标记。

然而,这样的方法目前仍然需要大量算力,因此很难在自动驾驶车辆上实时完成处理。为了解决这个问题,陆军邀请多位计算机科学家,由他们专职研究计算机架构与算法,旨在通过先进方法帮助陆军在自动驾驶车辆能够支持的处理器尺寸与功率限制内,达成预期效果。

陆军显然面临着商业部门难以想象、也完全无法解决的独特技术挑战。商用自主车辆不需要过多考虑运行环境中的破坏性因素——除了人员、障碍物甚至是意外事件,军事行动往往发生在极不确定的环境当中,地形危险而复杂、敌对方也可能设下种种威胁陷阱。

首批实例将采用远程操作形式,陆军也将在遥控过程中逐步摸索出此类车辆的操作方式,学习如何在战场上使用机器人。以此为依据,我们将了解应该开发出怎样的自主行为。最终,下一代战斗车辆将拥有现场学习、形势适应、推理以及有效采取行动,以支持多领域作战任务的能力。

问:面对AI挑战,您有哪些经验之谈?

John Fossaceca:近期的陆军研究发现,利用人类示范与反馈的深度强化学习技术已经取得了成功。这些新型方法的成功,大大减少了在新任务中训练系统的时间周期。

而通过人类演示的其他研究表明,即使只使用有限的示例,同样可以在战场上通过再训练获得一定程度的实用性、甚至是实时学习的潜力。这些技术似乎还能够与迁移学习相融合,即在一组条件下学习,并将模型成果引入至另一组全新条件,且无需从零开始重新训练。

问:在美国陆军看来,未来的战场与士兵将呈现出怎样的面貌?

John Fossaceca:在美国陆军看来,未来的战场上将出现无人编队,其速度远超当前人员编队。其中一项目标,是让自主系统对区域及路线进行侦察,发现或与敌方接火,同时为士兵提供防御支援。

问:AI技术对于陆军的未来发展愿景有何重要意义?

John Fossaceca:AI技术将成为未来多域作战中取得成功的关键驱动力。根据前陆军部长兼现任国防部长Mark Esper的说法,“如果我们能够掌控AI,那么它一定能够更好地保护美国人民。要在未来的战场上取胜,我们就需要比敌人更快行动,同时尽可能降低部队与资源的风险等级。谁能先实现这个目标,谁就将在未来几年的战场上保持决定性的优势。”

现任陆军部长Ryan McCarthy则表示,基于云的技术与功能将成为“AI最大化”道路上的核心因素。McCarthy希望全面推广云基础设施部署,借此推动AI技术发展。

问:陆军对于“以符合道德及负责任的方式使用AI技术”有何看法?

John Fossaceca:美国陆军及国防部都在高度关注AI伦理问题,并于去年10月提出了《关于以符合伦理道德的方式使用人工智能的建议》草案。这些规则也将适用于美国军队。美国军方将招纳人才,保证所有AI系统都有对应人员负责管理。

陆军的AI特遣队也设有一位道德官员,可协助通报AI道德政策。陆军部长Ryan McCarthy表示,“系统可以快速处理数据并提供答案,但却无法提供上下文信息。只有人类才能根据实际环境做出决策。”

问:目前,您采取哪些措施保证军方能够拥有充足的AI相关人力与作战人员储备?

军方内部是否正在开展AI相关培训与教育计划?John Fossaceca:ARL与陆军为学生提供大量实习机会与SMART奖学金,这些奖学金可以帮助学生支付教育费用。而作为交换,学生将为陆军工作一段时间。ARL还聘用了新的博士毕业生进行博后研究,借此将他们带入前沿研究领域。最终,部分博士后将成为内部员工。人工智能已经成为当前的核心研发方向,因此陆军也将逐步雇用更多具备这方面专业知识的科学家与工程师。

问:在帮助士兵适应与自主系统及机器人协同方面,您做了哪些尝试与努力?

John Fossaceca:我们之前讨论的各类自主系统仍在开发当中,因此目前我们只能在训练环境内使用仿真技术帮助士兵适应这些自主系统。陆军在这方面尚处于起步阶段,但确实正在推进部分计划,例如可重构虚拟集体教练机(RVCT)及其包含的地面与空中平台,这些平台能够使用模拟数据实现多种演练任务。

目前的大部分训练工作都集中在对“智能半自主系统”与“自主系统”的仿真模拟方面,这是为了给士兵提供身临其境的训练体验。士兵们在这类综合训练环境(STE)中与虚拟对手对抗。这些虚拟对手能够实施各类智能行为,其中甚至包含一定的不可预测性,用以模拟敌对方可能做出的选择以及合理的认知水平。这必然需要将最先进的人工智能与现实环境结合起来。

在基础研究层面,ARL则引导士兵与自主原型方案进行交互,帮助AI系统熟悉士兵的说话方式,以及他们倾向于使用哪些命令。反过来,士兵也将逐渐摸清AI系统的“脾气”。实际上,在引导士兵与自主系统协同训练之后,士兵们很快就开始尝试以更适合对方的语言进行表达,从而高效完成沟通与系统控制。

问:未来几年,您最期待哪些AI技术?

相关推荐