ktmhate 2019-06-27
近日,阿里安全图灵实验室(Alibaba Turing Lab)在Pascal VOC挑战赛(Pattern Analysis, Statical Modeling and Computational Learning)的目标检测(Object Detection)之Competition 3 :TRAIN ON PASCAL VOC DATA项目中获得了74.8分,刷新了该项检测的世界最好成绩。
据悉,PASCAL VOC挑战赛是视觉对象的分类识别和检测的一个基准测试,提供了检测算法和学习性能的标准图像注释数据集和标准的评估系统。在计算视觉领域,Pascal VOC挑战赛类似于数学中的哥德巴赫猜想,与ImageNet和COCO(Common Objects in Context)同为世界顶级的比赛。
PASCAL VOC的图片集包括20个目录:人类,动物(鸟、猫、牛、狗、马、羊),交通工具(飞机、自行车、船、公共汽车、小轿车、摩托车、火车),室内(瓶子、椅子、餐桌、盆栽植物、沙发、电视)。其数据集图像质量好,标注完备,非常适合用来测试算法性能,是深度学习图像领域算法性能检验的“标准”数据集。
阿里安全图灵实验室研究人员表示,PASCAL VOC拥有全球最为权威、通用的数据集之一,同时也极具挑战性。为此,他们研发了ATLSSD算法(Alibaba Turing Lab Single Shot Multibox Detection)。该算法基于one-shot的检测框架SSD,兼顾模型性能和效率,并在多尺度特征抽取层增加了层间连接,类似FPN(Feature Pyramid Network)结构;在Extra Network增加了RFB(Receptive Field Block)结构,增加特征层对于不同尺度、不同形态目标的表征能力;训练过程中模型利用Hard Negative Mining进行模型预热,然后利用Focal Loss进行finetune,使得在有限的数据下,通过learning from scratch达到较好的训练效果。
目前,图灵实验室的算法模型已广泛应用于阿里生态的淘宝、支付宝、优酷、UC等核心业务线,比如商品中的违禁内容、假货和视频的智能化防控等,并通过阿里云上的产品和解决方案(例如内容安全、实人认证等)为各企事业客户提供优质的AI服务。
“为了让算法更贴近业务,解决更为实际的问题。我们曾经推出过智能食堂项目,自主研发的刷菜图像算法实现了菜品的智能识别和支付结算,并借助物联网装置,在云端记录了用户每日每餐的食物成分。”阿里安全图灵实验室的研究人员表示,“我们在人工智能领域的研究为阿里经济体的智能化发展提供了强大的驱动力的同时,也为数亿用户创造了极致的体验。”
据了解,图灵实验室是阿里安全的顶级人工智能研发团队,专注于计算机视觉、自然语言处理、机器学习和深度学习等领域的技术研发,已先后申请了50多项专利,并多次在国际权威评测中刷新世界纪录(今年3月,在ICDAR2017 Competition on Multi-lingual scene text detection(MLT)自然场景多语言文本检测竞赛中就已经刷新了世界最佳成绩),其成员多为清华、北大、浙大、中科院等的博士或硕士。
本文作者:华蒙
阅读原文