科大讯飞董事长刘庆峰:AI在各领域应用落地需对应三大标准

jiaolinxi 2019-10-31

​​今天人工智能在各个领域应用的落地,有三大标准可以对应:第一个标准就是能不能看到真实的应用案例,而不仅仅是概念;第二个标准是这个案例是否可规模化推广;第三个标准是产品能否用统计数据证明应用成效,消费者会不会为其买单。

科大讯飞董事长刘庆峰:AI在各领域应用落地需对应三大标准

科大讯飞董事长刘庆峰

科大讯飞董事长刘庆峰在2019全球硬科技创新大会上做了“人工智能+应用是硬道理”的主题演讲。

以下为刘庆峰演讲全文(经整理):

尊敬的各位领导、各位朋友,非常高兴有机会跟大家分享关于人工智能在应用领域的最新进展。

硬科技,从源头硬科技到产业硬科技,是一个产业链条,今天非常高兴跟大家分享这方面的进展。我希望通过具体的应用案例和最实际的技术感知,让大家了解今天我们在人工智能科技上到底有哪些成果正在改变世界。

关于人工智能重要性不展开说了,全世界各地无论从科技界、产业界还是投资界包括政府都已经给了其前所未有的关注,因为它确实在深刻的改变这个社会的生产和生活方式。

今年9月16号,奥运会在历史上首次设了一个新的赞助项目,叫自动语音转化和翻译的战略项目,经过全世界的竞争激烈,我们成为这个项目的全球独家供货商,这个项目将打造人类历史上第一次信息沟通无障碍的奥运会。2022北京冬奥会和冬残奥会将成为史上第一个沟通无障碍的奥运会,所有的赛事发布,我们将中文全自动翻译成其它语种,全部的运动员、观众、还有志愿者沟通通过翻译机可以进行无障碍交流。

这样的技术之所以服务于奥运会,是奥组委在内部开会,并在世界各地应用了我们的翻译机以后做的决定。

5月15号联合国总部正式通过科大讯飞翻译机服务,在联合国日内瓦总部的会议上直接通过语音识别进行翻译。目前科大讯飞已正式和联合国联署了相关协议,并且已经在各种场合使用。人工智能确实进入每个人的身边。

科大讯飞今年创业20年了,我的导师在上个世纪70年代就在做语音和人工智能相关的研究,20年来我们的使命一直没有改变:希望让机器像人一样能听会说,并能进行思考和理解,把世界变的更加美好。

给大家看一下我们的发展状况:让机器开口说话即科大讯飞的语音合成技术。语音合成让我们不想用“看”的时候,可以变看为听,减少眼科疾病发生的概率。

国际上有优秀的比赛,2019年blizzard challenge堪称史上最难评测任务,科大讯飞获得关键指标自然度、相似度第一,讯飞系统自然度刷新历史新高达到4.5MOS分,与原声录音差距只有0.2MOS分。科大讯飞2016年到2019年连续十四年蝉联国际语音合成大赛冠军。

今年“两会”期间,中央电视台打造了一个“小白机器人”,可以学习模仿播音员的声音,我们也推出了面向“两会”的人工智能虚拟主播。这个虚拟主播现在可以用几十种语言对全世界进行直播,今年上半年产品发布会上,通过这个虚拟主播用各种语言在全球进行直播。

今天的语音识别,在安静环境下平均准确率可达到95%。这个95%什么概念?不用做口音训练,不用做场景训练,对任何人的语音识别,都可以准确识别到差不多95%以上,如果大家下载科大讯飞的输入法,准确率可高达达到98%。现在平均每天有1.3亿人在使用科大讯飞语音识别,可以实现中英文随时切换,而且覆盖了23种方言。

未来语音识别的核心应用在各种噪音情况下,比如车载、食堂、机场等。科大讯飞在CHIME-5国际英文语音识别大赛中蝉联所有指标第一,2018年9月包揽国际多通道语音分离和识别大赛全部四个项目得冠军,比官方系统提升35个点。这个领域有很高的技术门槛,因为有很强的背景噪音,组委会做了一个基线系统,这个错误率是80%,100个字听到20个字就不错了,但是科大讯飞超过基线系统的35个点,远远领先。现在汽车里安装上科大讯飞的语音交互系统很多,新的日系的主流车型,包括欧洲的车型,经过测噪音环境,只有科大讯飞的技术可以满足需求。这项技术降低了万物互联的时代门槛。

刚才主持人提到机器翻译,机器翻译到了什么程度?机器翻译不是替代人,不涉及人文加工的语言翻译,机器翻译将来可以做的非常好。未来的机器翻译,应该是人机结合的翻译,科大讯飞专门成立了人机耦合翻译的实验室,同传翻译的时候,我们把语音转化成文字,把关键内容点加亮加粗,同传老师可以按照需求有选择的使用、筛选,这样可以把细节完整度从80%多提升到将近100%,这个实验还在不断的进行中,相信将来会给大家带来更好的体验。

非常激动人心的是今年3月份国家正式给我们颁发了相关证书,去年我们的翻译机参加翻译二级考试,目前我们是唯一通过二级翻译的科技企业。去年让这个翻译机参加了国家英语6级的英语考试,跟大学生同时做翻译题,机器超过99%的大学生。

我带了一个小小的翻译机给大家,将来在“一带一路”倡议的发展下,很多语种会选择在西安做研发,这个翻译机现在有59种语言,这个翻译目前有几种全部是离线翻译,未来中国出国用户使用的90%以上的场景中都可以使用到离线翻译。

而且这个机器可以进行发言翻译,人工智能最大的优点是基于数据的自我学习,这是机器做不了很多人类做的事情的原因。

我们科大讯飞翻译机刚推出的时候 实验准确率达到80%,场景应用准确率高达60%,现在已经达到98%。这都基于算法的进步和数据的迭代和发展。

今天有必要讨论下各个领域人和机器如何耦合的方式,大家也必须认识到人工智能对这个社会的变化。

机器对人类的理解和思考到什么程度了呢?国际最新的标准就是自然理解能力,10万字的文章机器看了以后回答问题。科大讯飞在全世界让机器的英文阅读理解水平超过了人类,技术的进步使得机器可以阅读各个专业领域的文字,解决社会服务的各种需要。

机器还在英语和语文作文理解上超过人类,可以在高考和大学四六级考试中使用。9月份的雅思英语考试,最终确定科大讯飞作为合作伙伴,用人工智能解决考生的作文评测,以及考生在评测前的各种学习辅导,这些在以前是不可想象的,因为机器改作文这样的主观题,比下围棋还要难。

所以今天人工智能在各个领域应用的落地,不是空泛的说,有三大标准可以对应:第一个标准就是能不能看到真实的应用案例,而不仅仅是概念;第二个标准这个案例是否可规模化推广;第三个标准产品是不是能用统计数据证明应用成效,消费者会不会为产品买单。产品的应用一定是节约了多少成本、提高多少效率、减少了多少危险工作等。

在这三大标准下,人工智能在教育、医疗等非常多的领域使用。在教育领域可以实现因材施教,人工智能分析每个孩子的特点,把无效的重复学习降低,省出大量时间进行课外训练,进行综合发展。另外人工智能可以不断推动公益活动,可以让盲人“听见”文字,让聋人“看见”声音。另外人工智能在进一步保护方言,全世界方言每一到两周一种方言消失,我们目前已经启动“全球方言保护计划”。

人工智能的红利兑现今天已经到来。围绕科大讯飞平台的开发团队数量和合作伙伴的数量已高达到160万家,西安就有1.7万家,在过去一年增加70%以上。我们正在西安打造科大讯飞的丝路总部,打造我们人工智能研究院和西安人工智能产业创新的孵化器和产业集群。丝路总部不仅会做多语种研究,还会做好源头基础创新的产品,把产品的总部和未来收益都将布局在西安。

软环境决定了硬科技发展的速度。我们自从跟西安签订战略合作协议以来,我们不断的感受到了来自西安高新区的温度,西安高新区多次在关键时刻,通过发声援书来关心和支持科大讯飞,我感觉因为有这么好的软环境,西安的硬科技一定可以发展的更好。

我们也期待在西安跟大家共同发展,打造人工智能产业、以及打造人工智能时代更加美好的社会服务。

谢谢大家。

相关推荐