zengyu00 2017-05-27
主题:智能金融分论坛
时间:2017年5月22日上午
地点:国家会议中心403
本文根据速记进行整理
“智能+”时代的金融大数据应用
王健宗
平安科技大数据部高级产品总监,平安集团深度学习平台总负责人
下一位是王健宗博士,我们的安排是一位学界嘉宾,一位业内嘉宾,希望这个活动就像秘书长讲的要产学研结合。王健宗博士来自于平安大数据高级产品总监、深度学习平台总负责人,宣传册上写的是肖京博士,肖总今天有特殊的任务,平安保险大家知道,实际上平安是一个巨无霸的公司,平安员工有130万人,平安科技是其中一个子公司有8千人。我们讲人工智能、金融科技,平安是中国乃至世界上一支不可忽视的力量。王健宗是专门负责平安大数据平安科技的深度学习,我们在这个世界上已经听了太多深度学习上的事情,但是有一个前提,你的数据到底是不是够多,质量到底是不是足够好,你如果用这几个标准一衡量的话,很多事情是不成立的。
有多少人买平安的保险,你们为平安大数据做了贡献,平安有大数据,他是可以做深度学习的,所以我非常期待王健宗博士给我们一起来分享在大数据的情况下怎么做深度学习,有请王健宗博士。
王健宗:谢谢主持人,讲得比我好多了,大家听过之后恨不得现在就去买一个保险。今天这个论坛是智能金融论坛,我们理解智能金融其实就是人工智能的金融,AI+金融,我今天演讲的题目就是智能时代下的金融大数据应用。我4月底在这个会场全球移动互联网大会有一个讲话,时间比较短十五分钟,今天很感谢柳博士给了我三十分钟,我要好好利用好这三十分钟,把我们过去平安做的工作和我们团队做的工作给大家做一点小小的汇报,后面的交流时间请大家多多提意见。我们现在开始。
现在互联网+谈的是比较少的,主要是模式的创新,去年从阿尔法狗开始到今年一年多时间,大家谈的更多的是人工智能和智能+,我们更多的要思考的,人工智能不是一个新的名词,比起大数据和云计算来说,人工智能60多岁了,我第一次听到大数据是在美国2011年底,云计算2007年开始,云计算就十年,大数据就五六年,人工智能已经六十年了,六十年是一个老人,为什么一个老人焕发出婴儿一样的生机呢?更多的我们需要把人工智能结合一些应用做一些应用的创新。比如从传统的信息化、数据化到智能化,我们现在已经到智能的时代。
数据这个价值大家知道,从最底层的Data到information到知识到wisdom,数据越智能越具备自我学习能力,数据活跃度、数据使用的频次是越高的。平安从1988年到今天有差不多29年时间,今天是我们29年的司庆,怎么把我们的业务规则数据化信息化自动化,这是我们一直在思考的问题。我以保险理赔为例,大家都会买车险,一个车出险理赔有几千条规则,这里有三长一短选这个,三短一长选这个。但不只这些,车险理赔是几千倍规则的列表去驱动,这个规则是近三十年时间积累的规则,现在很多互联网公司要做保险,做保险行业非常需要业务积淀和相关经验的底蕴,现在有些大的互联网公司要进入保险业很难进入,因为保险非常要有积淀,非常要积累和经验。
我们把过去三十年的这些业务经验、业务总结,一直在想办法数字化,想办法自动化,这是我们做的一些工作。传统的方法,现在很多公司在做BI业务分群,大家会发现通过业务分群观念分析这样的工作,解决不了长尾问题,大部分用户你很难能get到他的特征,真正能辅导他。完全靠业务规则,我们有,但是把程序写成业务规则,怎么样去驱动,这些规则有些是相互,加上后来BI,没办法解决长尾问题,没有人工智能,以前踩的坑就不能避免掉。
人工智能三起三落。我很想举《西部世界》这个例子。这是个老的剧本,在《西部世界》里很难判断出这里面到底谁是真人谁是机器,只有一枪把它毙掉,才能证明它是机器。大家在生活中会发现感受不到很多机器都在运转,微信里面很多就是机器人,图灵测试,要不跟机器对一首打油诗,机器能跟你灵活对打是不是就是人呢。最近我看报道,大公司的聊天机器人能够作诗了,用作诗的方式去验证也不够。淘宝上购物的时候后面很多评论,很多评论是机器评论,阿里巴巴没办法,有一个产品是做众包的,每天会发一些任务,任务是希望你能通过你的人为判断找到哪一些广告帖是人工评论的,哪些是机器评论的,任务一天经常是几百万的量,后面又衍生出一些问题,怎么样把机器和人识别出来。
这一次人类是不是又要完蛋了?不好说,但是我还是持谨慎乐观态度,这次人工智能三个因素,我们有强大的异构计算能力,像GPU、FPGA、AI芯片,这些是很好的硬件的支撑。第二,被讲烂的大数据,今年明年讲大数据会越来越少。第三,深度计算,三个因素叠加,人工智能现在有这次机会,我希望这次不要很快就死掉,我自己本人和我们公司都在人工智能应用方面做一些工作,效果还不错,我还是比较乐观的。
阿尔法狗,去年我经常会放这张图,我不过多解释了,我很期待这周的比赛,跟柯杰的比赛在23日,这次比赛我先做个预测,柯杰会跟去年李世石一样赢一场,大家到时候看一看比赛结果。人下棋下不过计算机,后面在很多领域也干不过计算机。已经有医生和机器比赛,一千个片子看谁看得准,在一些专业领域机器慢慢在取代人的工作。李开复在一些大学里讲未来50%的工作都要被机器取代,很多工作都要消失掉。我常常开玩笑,无人驾驶很火,以后开车就是个贵族运动,就跟骑马一样,无人驾驶出来之后都不需要开车。
对于专业领域的人工智能来说我们慢慢有些进步,也有些大家目前看到的问题。我们怎么样解释它,我本身是负责我们公司深度学习组的,业内也没有哪个金融机构有我这么大的组,问我模型的运作模型是什么,可解释性深度学习是比较差的,围棋下赢以后,人家说围棋的主流是AI流,在学AI的打法。现在有很多公司、很多学校老师教授要做深度学习,我心想数据都没有做什么深度学习。有些保险公司刚刚出来一两年,连保险的理赔案件都没有,他说要做人工智能理赔保险,也不是非得大数据,我们是否也探索小数据小样本的深度学习,这是未来要去突破的。要有记忆增强网络等等,都是可以去尝试的。技术是不断在发展的,我们要结合应用去做更多的探索。
回到金融,从去年到今年智能投顾非常火,柳博士的公司就是已经在智能投顾、培养智能的交易人方面是业界领先了,机器人去做一些投资,大家看这个曲线,如果你的模型训练足够好是有可能超过人的组合。这只是其中的一个小应用。这个图是我首次发布的,今天来的都赚到了,我花好长时间研究金融人工智能,我上次在GMIC都没有讲这个东西,其实金融人工智能的应用场景是非常多的,营销风控运营决策,这个图要讲半个小时讲不完,因为我讲起来是发散性思维,我快速过一下,从金融领域关注的外围的大盘、营销、决策、运营、风控,再到相关的技术支撑,深度学习技术、机器学习技术,里面有核心的相关的工具、模型、算法来支撑外围的金融应用,是非常多的。
我经常跟我的团队说你们做一个领域出去其实都是可以开一家创业公司,现在做风险预警、反洗钱的、帮助一些银行或者小微公司做快速征信评估,现在已经实现急速的个人评估的方法,后面都是机器人审核,传统银行审核得几周,去企业贷款审核时间更长,还要实地考察,金融领域是非常多的。平安有130万人,有100万保险代理人,保险代理人也是全数字化全智能化的运营和管控,我们有做很多工作,包括推荐用户画像。因为时间关系,我对里面相关领域会择优来讲。
平安是一个全牌照金融公司,同时也有保险、银行、证券、互联网应用,我不是做广告,平安科技是专门服务于平安的科技公司,现在也在转型AI和金融大数据公司,所以我们在人工智能、区块链、金融云、大数据也构建很久了,应该是全球最大的大数据平台,我们这块做了很多工作,服务于相关的传统金融和互联网金融。
这个图也是全球首次发布,大家可以看一看,这是我们大的平台架构,我们从大数据起步开始,一直到现在做五六年的时间,我们从底层数据到形成一个画像脸谱,用户画像、产品画像、渠道画像,形成我们要做交叉销售和渠道这块。我们整个构建的是金融的平安网,整个智能引擎去支撑BI结构化数据非结构化数据预测监控,支撑我们相关的应用,智能、运营、机器人、健康、营销、风控、欺诈等等。
这是非常通用的客户交叉,从客户获新,一段时期里做交叉销售,最后怎么去做客户挽留的工作,这是经常看到的图。通过用户画像、产品画像加上渠道画像,实现互联网和传统用户的千万级的迁徙和转移,客户这个产品的跨度从1点几到2点几到接近3,这是很大的突破。后面通过相关的人工智能技术的支撑。我们做风险的预警,通过个人的风险量化、个人的征信,做风险的监控。整体上有个人的团体的企业的服务于银行、健康、投资、集合等等,这是我们通过社交网络的分析,像徐翔这样的热点事件,提前做一些风险和管控,背后有自动的风控官。
分析车险的相关事件,这个图是平安好车主,在行驶过程中预警哪个地方是事故高发的地段,这个时候要注意。还有舆情分析,企业关系网络等等。同时我们也做非结构化数据的分析,非结构化数据分析,有些欺诈案件车坏之后要4S店老板打一个电话,我们发现有个人在某个市某个区的某个4S店老板一个月密集打十几个电话,我们通过后台语音的分析、声纹分析比对,定位这个人是高风险用户,欺诈度比较高。有一个小额贷的普惠会做线上贷款,审核员跟你面对面沟通过程中有微表情的提示、测谎,我们都有技术辅助。
图像方面,一个车都有些欺诈,我们需要提早预知这张图片是否有伪造。非人类特征识别,现在很大一个程度国内自然灾害和天气导致农民损失很严重,我们构建猪的生物特征库、鸭的生物特征库、鹅的生物特征库,现在国家补贴很大,经常会有一个问题,一头猪国家给你10块钱20块钱投个保,如果发生病害去除自然死亡的病害,长到育肥猪的时候突然死掉了,这个时候他找我理赔我要判断这头猪就是育肥猪的这头猪,非人类生物特征,我们也在做这块,服务于农业险。
人脸识别很成熟,我们都是很创新,这块欺诈很多,有一个村里投500头猪,有些猪不是全投的,如果全投没关系,只要死就赔,有些只赔一半,这头猪死掉了之后,我不知道这头猪是否投保。以后要扩展到宠物,养金毛很贵重,投50块赔1万块,最后怎么证明这只狗就是理赔的这只狗,我们都在做这块。构建非人类特征识别库,这是非常超前的,也有很多技术挑战,这个领域也非常大。举刚才猪这个事情,我们做过市场调研,每年市场100亿。保险作为财产险来说各种各样的动物都需要识别反欺诈。
我们也做全渠道的接触,能够服务好客户,催收方面我们会分析个人行为,制定不同的催收策略,智能化,减少催收的人力或者粗暴催收。我们自己也有一个机器人做门店的运营,有机器人做一个客服。
AI在金融行业是大有可为的,我只是举的工作的1/10给大家做汇报,待会儿对话大家可以深度讨论,这是我的微博,我们可以深度交流,谢谢大家。
主持人:王健宗刚才提到特别重要一点,猪的生物特征识别,我第一次听说做猪的生物特征识别,最重要一点是需求在哪里,这个世界上有太多做人脸识别的,只有真正知道需求在什么地方的时候才能想出猪的生物特征识别。考勤人脸识别,解决你是你的问题,当然现在还没有解决你妈是你妈的问题,煤矿工人下井上来脸全是黑的,这个时候怎么解决他是他的问题,能指纹吗?这个时候用虹膜识别法,如果这个人出了事故以后怎么理赔的问题,刚才他讲了猪的理赔问题。第二个有意思的事情是计划生育,很多人为了生孩子,你无法知道这个人到底生的多少。为什么请王健宗来,王健宗是知道真正的数据长什么样子,知道需求在哪里,如果要雇一个杀手一定要找一个杀过人的杀手,如果要找大数据专家一定要找真正摸过大数据的专家。
CAAI原创 丨 作者王健宗
未经授权严禁转载及翻译
如需转载合作请向学会或本人申请
转发请注明转自中国人工智能学会
交叉、 融合、 相生 、 共赢