黑产肆虐的背后,人工智能能做多少?

三节课 2018-01-10

上个月某媒体的一篇《双十一黑产狂欢:数十万撸货大军,薅一天,够吃一年》的 10 万+文章,让很多用户第一次接触到“黑产”这个隐藏在水面之下的行业。 2017 年中国互联网电商创造了 7 万亿左右的网络零售额业绩,面对如此巨大的市场,如何处理类似像黑产猖獗这类安全问题,就成为各大互联网公司都必须面对的当务之急。而这,仅仅只是互联网安全守护者们所要对抗的冰山一角。在这场战争中还有黑客攻击、软件漏洞、信息泄露、计算机病毒等,每一个分战场,从今天的中国互联网电商的规模来看,都可能会是几十亿上百亿的金融安全问题。如此复杂的战争,如何保证安全?这些为人熟知的互联网电商公司,又有哪些能克敌制胜的杀手锏?

京东信息安全的负责人TonyLee,用“智能无界,安全有界”的理念来定义智能时代安全发展。他认为不断创新的AI和大数据技术,可以驱动并帮助信息安全走向更深的安全变革。用最前沿的技术手段,来革新安全思路,从长远来看,成效仍有待考验。不过,有一个小细节可能会验证他思路的正确性:在 2017 年 11 月的大促期间,京东以 1271 亿的销售额排名前列,但它所受到安全威胁和攻击量,相比行业其他的电商品牌却低很多。这或许说明了京东信息安全团队,构建的技术性安全防护体系与主动对抗的安全措施,是不错的方向。

在新加坡刚刚结束的StrataData大会上,Tony Lee也透露了京东信息安全团队更多的安全举措和实战策略。这个全球最顶级的大数据会议,聚集了欧美和亚太地区的大数据领域最有影响力的产业决策者和战略专家。Tony Lee在主会场Keynot分享了题为:JD.com Security Intelligence and Analytics: From Big Data to Big Impact的精彩演讲。

黑产肆虐的背后,人工智能能做多少?

京东作为中国最大的零售商,总用户多达 2 亿 3 千多万。京东的数据后台,每天要处理海量的订单和天文级的数据量,稍有疏忽,批量注册、虚假订单、虚假评论、黄牛套利等安全隐患就能成为可能。而“黑产”就是其中最显著的一个破点。网络之上的购物盛宴有多狂欢,隐匿网络之下的黑产就有多疯狂。在黑产从业者面前,传统的网络安全手段已然显得被动滞后。与此同时AI与大数据的迅速发展正在帮助信息安全走向全新的视野。对待黑产从业者,Tony lee带领的团队有几招连环拳。

Tony团队在UCLA做数据挖掘研究,分组研究各种项目,风洞,医疗,供应链等,揭示出大数据和AI技术研究的重大挑战是跟big impact的场景连接在一起,要有大量真实数据。JD总用户多达 2 亿 3 千多万巨大规模和丰富场景为我们的研究提供有效的真实数据。

Tony在分享中讲到:我们希望跟每一个人建立深度的个性化的连接,塑造强大的体验,如果没有"信任"这一切都无法实现,如果数据盗窃个人隐私,无人机、无人车受攻击坠毁,智能家居被黑客利用(去年美国的Mirai攻击),在AI,云计算和大数据的时代来临,我们面临的网络空间安全挑战变得更大。在安全行业发展过去 20 年,黑客和黑暗势力有更多的优势,他们躲在黑暗里,伺机而动,只需要成功一次,但我们做安全不能失败一次,这是一场非对称的战争,所以那么多的大公司不断爆出被攻破的事件。正如机场需要有安全人员保障,但所有规则驱动的防御都是可以被绕过得,所以以intelligence智能为核心的安全才能给与我们一个打赢黑产的机会。

黑产肆虐的背后,人工智能能做多少?

一、解决批量注册是关键

Tony带领团队从威胁情报、机器学习入手。通过技术将特定的威胁进行“画像”,对于相关信息进行描述,并给出可采取的对策,以帮助决策。通过无监督学习的方式,在事先不需要标注好样本的情况下,通过大数据可以自动找出一串串具有好坏不同特征的账号。其次有监督学习,

二、先进的反欺诈技术

京东的信息安全团队具有多年的技术积累。他们独特的产品思路也为反欺诈深度赋能,围绕“提前拒止”、“全链路监控”、“深度分析,高效追溯”、三大工作核心,让反欺诈的能力日益成熟。

1.提前拒止:当黑产团伙通过各渠道联系用户进行欺诈时,准确识别风险行为,提醒用户并阻断风险。京东安全依托海量的风险数据,对电信诈骗全过程中的诈骗电话、短信、钓鱼网站等信息精准分类,使用大数据分析生成行为特征。进而将其核心集成于京东APP,让每个用户在享受安全的购物环境,同时也避免了因安装其他安全APP而带来冗杂沉重的用户体验。

2.全链路监控:一个订单的生命周期,自用户浏览开始直至收货后,整个过程经历着众多环节的数据流转,而每一个环节的缺陷都可能导致数据泄露。及时的发现风险、解决风险是保护数据安全、防止诈骗发生最有效、却也最困难的方式。京东信息安全团队以此为切入点,深入用户、业务、物流、第三方厂商进行调研,分析数据流转的特点与路径,通过反复的调整完善,最终确定了一条覆盖订单数据全生命周期的流转链路,适用于98%的京东业务。对链路中的各节点数据的属性、时效、量级等多达 30 个特征进行了聚类学习,形成了对应的算法模型,同时也解决了与第三方商家、厂商、物流等第三方数据交互后安全难以保证的难题。

3.深度分析,高效溯源:“京犬”反欺诈分析平台,为京东安全反欺诈工作中最为重要的一部分,除集成了数据信息收集、数据链路监控等功能之外,同样具备了事件分析与溯源的能力。上线后对欺诈事件的调查处理效率提升了50%以上。通过将传统的人工调查方式转化为算法模型,再结合数据链路监控,依靠系统进行自动化进行查询、运算、推演,最终生成分析判断结果。平台也将AI技术融入其中,日常可根据人工设定的事件训练样本进行自主学习,不断优化更新其主要模型,大大提升了平台的分析溯源的能力。平台以“预警—分析—止损—溯源”为目标,现已完成两期更新迭代,后续将不断开发优化,进而继续为欺诈事件的排查以及协助公安机关溯源打击贡献重要的力量。

三、基于用户活动的弹性拦截技术

用户有相当一段时间没有登录,当有一天突然登录并发现其登录行为有所不同时,京东会提示并要求其输入验证码;当京东发现用户的账号信息在其他网站泄露后,登录京东时也会被系统要求用户更新自己的账户密码。

四、开放联合与国内外高校合作

京东信息安全部也秉承开放、联合、相互学习的态度,积极与国内外的高校合作去解决这类问题。开放邀请全球顶级专家、科研团队一起合作研究。在人工智能研究方面与美国斯坦福大学成立人工智能实验室,并与清华大学、加州大学伯克利分校、印第安纳大学、爱荷华州立大学联合进行物联网、人工智能安全、NLP和威胁情报的项目研究。

在互联网安全的战争中,如何更好的保护用户、保护企业的利益,仍然有很多战役要打。京东在信息安全和用户保护方面,一直也在努力。正如Tony Lee所说“我们一直谨记用发展的眼光去对下一个风险做准备”。当人工智能、大数据以及语音图像识别已经是下一个技术风口时,安全信息手段利用最新的科技成果,也就成为必然。甚至同时,网络安全如何为新风口下的新产业形态保驾护航,也会成为新的问题。京东的网络安全接下来还会有什么新的创举?让我们拭目以待。

相关推荐