CCAI2018|机器也有诗与远方——自然语言处理方法和应用

AI深入浅出 2018-06-25

今年“两会”期间,具有代表性的同声传译产品给大众留下了深刻的印象。时至今日,机器翻译的新闻已屡见不鲜,刚刚过去的端午节(6月18日),IBM的Project Debater在一场人机辩论赛中展现了清晰的思维和出色的应对反驳能力,最终驳倒了人类。讲道理,连伶牙俐齿的最佳辩手,都已经讲不过机器了。

CCAI2018|机器也有诗与远方——自然语言处理方法和应用

语言和文字是人类文明的载体。从人类诞生起,沟通需要语言,记录需要文字,不同语系之间的交流还需要翻译。语言作为人类智能最重要的标志,如何用计算机来处理、理解和运用人类自然语言?是人工智能研究的核心问题之一,已有近百年研究历史,具有重要的科学研究意义和产业应用价值。

自然语言处理(NLP)最早被人类用来解决机器翻译问题,随后进入搜索引擎应用、语义分析及大规模文本处理领域。在自然语言处理的发展过程中,计算机也领教到了人类语言的博大精深,比如对于国足水平这种送分题,也是要蒙圈的:“巴西队谁也踢不赢,中国队谁也踢不赢。”

在处理人类语言文字这种高维度、抽象化、灵活多变、界限模糊的非结构化数据时,计算机有着先天的劣势。因此,NLP也被认为是人工智能领域最难解决的问题之一,比尔·盖茨甚至将NLP形容为“人工智能领域‘皇冠上的宝石’”。

为了推进NLP领域的发展,科学家做了长期的艰苦努力,然而在很长一段时间内都收效甚微。上世纪90年代,人工智能已经能够在自动控制、金融信息等领域辅助人类,可是,在完成简单的文本翻译和语音识别任务后,NLP领域的研究陷入了多年的停滞期。深度学习时代的来临,重新加速了计算机语言与人类语言对接的进程。

如今,计算机已经在某些细分领域拥有理解和处理大规模文本的能力,我们平时使用的搜索引擎、智能翻译、个性化信息推送和苹果的Siri等产品都日臻成熟。甚至,今天我们在朋友圈看到的某些消息,已经很可能不是人类所撰写的。2014年,美联社开始使用AutomatedInsights公司的Wordsmith平台自动编发企业财报并生成新闻快讯。同时,腾讯的写稿机器人DreamWriter自2015年上线以来,已经在体育、财经、娱乐等领域的新闻写作多点开花,基本能够在常规的快讯和新闻类报道中取代人类的工作。

本次的CCAI大会,自然不会错过NLP这颗“皇冠上的宝石”。作为国内NLP领域顶尖学者,苏州大学特聘教授,计算机学院副院长,人类语言技术研究所所长、国家杰出青年科学基金获得者的张民教授将以《自然语言处理方法和应用》为题做专题讲座。

什么是自然语言处理和自然语言理解?其研究历史、研究内容、研究现状、研究方法、技术应用、产业需求、挑战和未来的发展方向是什么?近两三年来,深度学习技术使很多人工智能问题的准确率得到显著提升,那么深度学习技术为自然语言处理带来了哪些新的发展机遇?展望未来,NLP面临的挑战和发展方向是什么?我们如何畅想与机器人对话的未来场景?以上这些,我们都将能从张民教授的报告中得到答案。

相关推荐