CCIS 2019丨王斌:NLP的黄金时代来了

天才幻想家 2019-11-19

19-21 CIIS2019

December

CCIS 2019丨王斌:NLP的黄金时代来了

2019年第六届CCIS云计算与智能系统国际会议将于12月19日-21日在新加坡召开。CCIS云计算与智能系统国际会议由中国人工智能学会联合IEEE发起,是中国人工智能学会建设世界一流学会,深化国际交流与合作,提升我国人工智能世界影响力系列举措中一项重要的国际活动,每届规模保持在400人左右,以高规格、高水平的特色深受国际同行关注,形成了“小而美”的会议风格。今年,CCIS应邀出国,首次在海外举办。

小米公司人工智能实验室主任、NLP首席科学家王斌博士确认出席CCIS 2019,并发表主旨报告。

CCIS 2019丨王斌:NLP的黄金时代来了

王斌

王斌博士于1999年获得中国科学院计算技术研究所计算机科学博士学位,现任小米公司人工智能实验室主任、NLP首席科学家,中国科学院信息工程研究所客座教授,主要研究领域包括信息检索和自然语言处理。

王斌博士在TKDE、SIGIR、CIKM、ACL和EMNLP等期刊和会议上发表了150多篇研究论文,他的团队曾三次在国际学术竞赛中获得第一名,他还领导开发了多个内容检索系统,并获得国家科技进步二等奖两项。他是多个技术委员会的成员,并担任多个会议的程序委员会委员,包括SIGIR、ACL、WWW、AAAI、IJCAI、CIKM等。

毋容置疑,NLP是人工智能最具挑战性和未来性的应用技术之一,在小米的AI布局中,NLP是至关重要的一个领域。王斌博士在小米的技术领导方向很重要的部分也聚焦在这里,比如对“小爱”机器人的自然交互能力的提升。

最近几年,NLP 技术发展和产品应用迅速,如聊天机器人、机器翻译、机器阅读、机器写作等等,都已经在各种工作场景下能够经常见到。特别是是在手机上,现在很大一部分APP的搜索和交互入口都具备语音功能,这其中就有NLP不可替代的功劳。

作为NLP领域的资深专家,王斌博士的判断是:NLP 迎来了历史上的黄金时代。

他认为,大量自然语言数据的存在,使得 NLP 的数据基础非常坚实。与此同时,NLP 的需求一直非常旺盛,学界和工业界已形成良性循环。数据积累与行业需求的双重因素决定了NLP的广阔前景。典型如,在小米的一系列产品和服务中,NLP的应用已经很普遍。

即使是即将迎来高速发展时期,但NLP的突破依然面临困难。

王斌博士认为,NLP挑战众多,但有两个至关重要的问题:一是标注数据问题,二是优质模型问题。

标注数据问题:当前主流方法的效果取决于标注数据的规模和质量,获得大规模的高质量标注数据永远是个难题。要解决这个问题,一种可能的方法是通过自动标注或者半自动标注或者自然标注来扩大标注的数据量。另一种可能的方法是通过弱监督或半监督方法来充分利用大规模的未标注数据。

优质模型问题:当前的主流模型需要消耗大量资源进行训练,这种趋势目前看来有增无减。如何得到轻量级的优质模型是一个挑战性问题。可能的方法包括对现有模型的裁剪甚至另辟新路提出新的模型。

在第六届CCIS云计算与智能系统国际会议上,王斌博士将带来一场主题演讲,分享内容涉及NLP在小米业务中的探索和落地,以及目前国际上NLP的研究进展和重要挑战。

CCIS 2019丨王斌:NLP的黄金时代来了

The 6th IEEE International Conference on

Cloud Computing and Intelligence Systems(CCIS2019)

The 6th IEEE International Conference on Cloud Computing and Intelligence Systems (CCIS 2019) will feature an attractive technical program on the theme of "Cloud Computing and Intelligence Systems". This conference provides a high-quality forum for researchers and practitioners to present their latest theoretical and practical work on the cutting-edge technologies and hot topics in the areas of Machine Learning, Computational Intelligence, Evolutionary Computation, Big Data Computing Systems, Computer Vision, Pattern Recognition, Deep Learning, etc.