qudaqu 2018-06-13
乡音,是最亲切的声音。根据一个人的乡音可以分辨他的故乡。在全球化浪潮的冲击下,方言日渐式微。讯飞输入法从2017年其,就发起“方言保护计划”,建立“中国方言库”,用智能语音留存、传承、发展承载传统文化积淀的方言。该计划在全社会起到了一定的示范和引领效应,同时对方言保护有了更深入的思考。
日前,讯飞输入法媒体见面会上启动“方言发音人招募”公益行动,面向大众采集标准发音标本,利用人工智能技术实现方言的完整复制,让地域文化印记更深刻,进而推进中国语言资源保护公益事业。AI赋能讯飞输入法,为大众带来更丰富功能、更出色体验;另一方面,AI持续赋能方言保护,为世界留下多彩乡音。
科大讯飞多语种高级研究员祖漪清在现场讲述了方言势微的现状。现在我们身处人工智能崛起的时代,利用人工智能技术进行濒危语言、方言系统地研究一个语言的语音结构、语言结构,实现对一个语言的完整“复制”迫在眉睫。因此,本次媒体见面上正式启动了“AI方言发音人招募”公益行动。
为更好提升方言保护水平,希望有志于此的用户参与讯飞输入法“方言发音人招募”公益行动,用标准乡音保持各地文化的活力。“方言发音人招募”与地方政府、地方广播电视台等开展深度合作,寻找发音人。2018年5月,科大讯飞、苏州广播电视总台,联合苏州市政府、中国语言资源保护研究中心共同启动“苏州方言保护计划暨非物质文化传承孵化平台”。6月深入黔东南苗族侗族自治州丹寨万达小镇,招募当地方言放音忍,推进丹寨苗语方言保护。另一方面在线上发布“方言保护”APP及“我AI说方言”微信小程序,为乡音代言,同时讯飞输入法设置中加入了方言收集互动入口,助力方言留存。近期讯飞输入法又与快手合作,借助短视频平台为AI方言保护公益注入新鲜活力,吸引更多年轻人参与其中。
讯飞输入法以自然语言交互方式——语音修改来解决当前技术束手无策的 2% 不准确。也就是说,使用语音输入的过程中通过自然语言说出指令来修改、添增、删除文字等操作。由于中文拥有复杂的多样性,同音不同义的词非常丰富,这对机器而言存在理解难度。所以,讯飞输入法新增语音修改结果多同音词候选,在机器不能准确理解语义时,通过人工选择更加高效。不仅如此,基于Cache Base Fast Adapation技术,讯飞输入法独创的“智适应”支持一次修改自动记忆修正结果,再次输入相同内容精准识别。
受制于复杂的环境,像含糊不清的口音、噪声环境、多人对话场所等都给语音识别造成影响,一旦识别错误就可能改变整句话的意思。对于口音和方言识别的难题,讯飞输入法提出方言语音输入方案来解决。依托科大讯飞对AI技术及语言深度研究的积累,采用Multi-lingual多语言建模,通过多方言数据共享方式训练;辅以Global Phone全球音素集,从声学层面的相似性统一各方言的音素定义,对方言“语图谱”模型做进一步精进,从而有针对性地提升方言语种的识别能力。目前讯飞输入法支持22种方言,其中粤语、四川话、东北话等识别率均已超过90%。
基于科大讯飞精简和优化的Hybrid-DFCNN全新语音识别框架,6月底讯飞输入法将上线Hyper-CNN语音新引擎,随之通用语音识别准确率将相对提升15%,此外有效优化中英混合语音输入、粤语等重点方言、标点判断准确率,提升语音输入的体验。
在方言保护领域,科大讯飞目前已拥有30多个语言、少数民族语言及方言的语音系统(文语转换、语音识别、语音翻译),其中实现多个拓荒性语音系统,并在中文普通话、英语等强势语言以外的许多语音合成系统上突破了MOS4.0的门槛。值得一提的是,已经实现了藏语、维吾尔语,语言的完整复制。锡伯语等濒危语言,语言复制中文语转换模块,在平行文本齐备的情况下,即可形成完整的语言复制。