专访Uber焦加麟:即便有AI帮助,高精度地图制作仍然少不了人力

Aspirin0 2018-04-18

专访Uber焦加麟:即便有AI帮助,高精度地图制作仍然少不了人力

作者 | DavidZh

出品 | AI科技大本营(公众号ID:rgznai100)

上周在 O'Reilly 和 Intel 人工智能2018北京大会上,Uber 公司资深软件工程师焦加麟做了关于人工智能在高精度地图制作中的应用分享,并接受了 AI 科技大本营(微信公号:rgznai100)的采访。

焦加麟 2015 年加入 Uber,一直负责地图相关的软件工程工作。进入 Uber 之前,他在微软 Bing 的美国总部从事开发工作。

专访Uber焦加麟:即便有AI帮助,高精度地图制作仍然少不了人力

就目前自动驾驶的发展阶段而言,从 L2 到 L3、从 L3 到 L4,随着车辆对驾驶者注意力需要的减少,高精度地图中的道路数据和语义对于实现高级别自动驾驶越来越重要。而在安全层面,高精地图的数据量越丰富、更新越及时,意味着自动驾驶车也越安全。

高精度地图的采集方式

作为自动驾驶的基础服务之一,高精度地图的采集和制作通常由地图数据服务提供商来完成。这其中既包括像 TomTom、Google、Here 等做了很多年的传统地图提供商,也有一些近几年才成立的初创公司,比如 Mapillary 和 lvl5。

从高精地图的采集方式来看,目前主要分为激光雷达+摄像头辅助和仅使用光学摄像头两种方法,但各有优缺点。

首先,激光雷达能够快速获得道路及周边环境的三维点云数据。这些数据中包含了景深信息,能够在后期数据处理时快速建立 3D 模型。而且激光雷达的工作条件基本不受时间影响,无论白天还是夜间都可以装在到车上进行采集。

不过,需要指出的是,激光雷达并不能识别和理解交通标志牌、交通信号灯等内容,采集时要借助普通的光学摄像头来捕捉并提取这部分信息。

但普通摄像头要求外部环境光线充足,因此地图采集工作只能在白天进行。另外,摄像头拍下的照片不包含景深信息,需要通过三角定位等计算方法来确定道路标识的具体位置。

据焦加麟介绍,前文中提到的 lvl5 就是湾区一家纯靠计算机视觉方法来采集和制作高精度地图的公司。

lvl5 采用了众包的方式获得路况原始数据。这家公司通过让个人车主和司机安装好自己开发的 Payver 应用,并在开车时运行它,来采集路面和周边环境的 2D 图像。为了保证数据质量的统一性,Payver 只有 iOS 版本,而参与采集地图数据的用户也能获得一定虚拟奖励。在不到三个月的时间里,这家公司就通过这种众包参与的方式覆盖了美国 90% 的高速公路。

一般而言,摄像头每秒拍摄的内容越多,后期需要处理和融合的数据量就越大。焦加麟称,目前主流的做法并不是直接录制视频(高码率意味着数据量庞大),而是按照每秒不超过 10 帧的频率自动拍照。在采集车行进过程中,这个频率既能保证从不同位置和角度获得了道路及外部信息,又能将原始数据规模控制在比较理想的范围内。

除了 lvl5,被英特尔收购的 Mobileye 也在它的路书(RoadBook)中大量使用摄像头来制作高精度地图。

而 Google 旗下独立于 Google Maps 的高精度地图团队,则采用了比较常见的激光雷达+摄像头辅助的方法。

就目前而言,这两种方法还没有孰优孰劣之分。初创公司没有历史包袱,在采集和制作高精地图时技术方案的可选范围比较灵活。而 Google、Here 等公司有低分辨率的母图做基础,需要叠加更多立体图层和语义层。这就要考验数据采回来之后,数据融合处理的水平了。

高精度地图的数据处理

焦加麟在分享中讲到,地图生产流程主要涉及位姿(pose)修正、数据处理、位置检测和语义生成四个环节。

专访Uber焦加麟:即便有AI帮助,高精度地图制作仍然少不了人力

这些过程需要大量的软件辅助和人工作业。目前在 Google 和 Uber 内部,都设有专门的地图数据标记(labeling)团队。经过手动标记的地图数据连同语义信息一起被输送到循环训练的机器学习或深度学习模型中。

这些算法模型输出的低可信度数据要再次经过手动标记,然后再次进行算法处理。高可信度数据则被收录为高精度地图数据库。

专访Uber焦加麟:即便有AI帮助,高精度地图制作仍然少不了人力

对于个体而言,数据标记是一份相当枯燥的工作。而利用 SLAM 和计算机视觉的方法,已经将数据处理环节的人工作业量降低不少。

举例来说,平面交叉路口的非直线路沿,在过去一般要手动描多个点才能将数据结构化和语义化。现在可以基于点云数据利用启发式规则提取出不规则路沿,其中主要考虑的参数是高度差和密度变化。

专访Uber焦加麟:即便有AI帮助,高精度地图制作仍然少不了人力

而针对交通信号灯,Google 的无人车团队采用了离线 SLAM 优化和多重机器学习模型来确定信号灯的具体位置。目前公开的数据显示,大约有 95%-99% 的交通信号灯是通过这种方法生成位置,且误差不高于 15cm。

专访Uber焦加麟:即便有AI帮助,高精度地图制作仍然少不了人力

除了这些,还有不少团队采用了不同方案来确定标识牌位置和语义信息。但最终的高精地图质量控制和校验环节还是主要由人来完成。

高精度地图的另一个难点在于,更新的及时性。据 TomTom 估计,美国的公共道路每年大约有 15% 会发生某种改变。这就要求地图服务商以更灵敏快速的方式更新地图数据库,其中也少不了大量使用人工作业。

总起来看,高精度地图在制作层面已经用上了不少 AI 算法的帮助,但目前最领先的自动驾驶团队 Waymo 也只在美国凤凰城等有限几个城市拥有可以满足 L4 级别的高精度地图。

放大到全美或者全中国范围来看,采集和制作高精度地图还是一项非常浩大的工程。

题图来源:TomTom

相关推荐