大数据文摘 2019-04-17
编辑 | 琥珀
来源 | AI科技大本营(id:rgznai100)昨日,在旷视科技联合北京智源人工智能研究院举办的发布会上,旷视研究院发布了物体检测数据集 Objects365,包含 63 万张图像数量,365 个类别数量,高达 1000 万的框数。旷视首席科学家兼研究院院长孙剑在活动上表示,该数据集也是新一代通用物体检测数据集,具有规模大、质量高、泛化能力强的特点。
Objects365与大型经典数据集的基本对比
相较于 COCO 数据集,Objects365 包含 63 万张图像,数量约 5 倍于COCO;包含约 1000万标注框,数量 11 倍于 COCO 数据集标注框;Objects365 每张图像的平均标注框为 15.8个,更是 2 倍以上于COCO数据集;同时还涵盖了 365 个日常物体类别。
Objects365 与 COCO/VOC 详细对比
由上图可知,即便去除其他类别而仅考虑收录于 COCO 或 VOC 数据集的 80 类和 20 类,在每张图像平均框数和类别数这两项指标上,Objects365 依然优于 COCO 和 VOC;通过分析发现,原因不仅在于数据分布的不同,还在于标注过程减少了漏标,尤其是小目标。此外,Objects365 的平均标注区域占比也超过 COCO 和 VOC。
4 类数据集中,图像包含类别数的对比
如图所示,4 个不同的数据集中,拥有不同类别数量的图像所占的比例;Objects365 的峰值是每张图相平均具有 5 个不同的类别;而其他三个数据集,大多数图像所包含的类别数量在 1-2 个。
孙剑表示,算法优化的上限严重依赖于基准数据集的质量。为保证标注质量,在打造Objects365时,旷视设计出一套科学而严格的标注流程。
Objects365 的标注图像示例
此外,Objects365预训练模型在使用过程中,可以轻松超越现有算法的精度,显著加速收敛过程,表现出极强的泛化能力。在执行COCO、VOO Det、CityPersons等检测任务时,在VOC Seg和ADE等分割任务上均有显著提升。
DIW 2019 挑战赛启动
此外,由旷视科技旷视联合北京智源人工智能研究院举办的 Detection In the Wild 2019(DIW 2019)挑战赛也发布会当天正式启动。
赛程安排:
主办方为每个赛道的冠军队伍准备了10000美元的奖励。届时,优胜队将在CVPR现场的研讨会上介绍经验,共同探讨检测问题的瓶颈及优化方向。
DIW2019挑战赛的比赛赛道分为三个赛道,即Objects365赛道、Objects365小赛道和CrowdHuman赛道。
更多信息可查看:
https://www.objects365.org/workshop2019.html
智源学者计划拟公式
旷视研究员张祥雨入选
发布会上,北京智源学者计划对外进行了透露,并对首批智源学者的候选人名单进行了拟公示,共9位,分别是:
此外,发布会上,“北京智源 - 旷视智能模型设计与图像感知联合实验室”成立,该联合实验室拟由旷视研究院院长孙剑任实验室主任,研究员周舒畅任实验室副主任。
(本文为AI科技大本营整理文章,转载请联系联系 1092722531)