liujainq 2017-07-07
机器之心原创
参与:高琳、微胖
2017 年 3 月 21 日,小米电视系列新品——小米 4A 发布会上,智能语音搜索功能成为最大亮点。比如用户搜索时说「半月传」,系统也可以明白用户的意图,输出「芈月传」的结果。还有「神探夏洛特」也可以自动识别成「神探夏洛克」。
4A 被小米称为首台人工智能语音电视,这背后集聚了三角兽科技的模糊语义理解和问答技术,而这家公司也曾因为向锤子科技 Big Bang 语义识别功能提供底层技术而备受关注。
三角兽致力于利用自然语言处理(下简称 NLP)、深度学习技术,打造中文聊天对话系统。对话系统是人工智能的一个子领域,实现人与机器自然交流。「这三四年来,我们发现越来越可以接近这个目标。现在我们依靠数据,希望用机器去学习人和人是怎么对话。」三角兽联合创始人兼 CTO 亓超说。
一
2004 年,还是辽宁科技大学硕士研究生的亓超初次接触自然语言处理。传统对话系统主要依据预先设计好的脚本与用户交流,比如,Facebook Assist 需要输入编号来执行动作。深度学习网络的出现改变了很多技术领域,包括推进了自然语言处理领域快速向前发展。正如 Sheffield 大学教授、亚马逊人工智能团队成员 Neil Lawrence 所说,「NLP 有点像是深度学习机器车灯前的一只兔子,等着被压扁。」使用了深度学习网络的对话系统越来越聪明。
三角兽联合创始人兼 CTO 亓超
伴随着技术的不断迭代,不少大公司在推进基于 NLP 的应用方面开始有所突破,亓超也在该领域扎根长达十几年时间。他曾在第一代微软小冰中负责核心算法、也是百度度秘开放域聊天负责人、聊天及人机辅助负责人。他始终认为,「尽管到现在为止,(NLP)也没有完美解决它面临的问题,但不妨碍所有东西都用起来,它永远不可能达到完美,但把技术应用到生活中,这是非常重要的。」
认定行业前景的亓超,找到同在百度「度秘」项目的王卓然,两人一拍即合,王卓然说,「这个方向在这个时间点上是一个大有可为的事情。」王卓然还找来高中同学马宇驰任 COO,后者擅长融资、运营和市场,与两位技术搭档形成互补。2016 年 2 月,三角兽正式成立,两个月后,获得洪泰基金和天善资本 1000 万人民币的天使轮投资。今年 1 月完成 A 轮融资,融资额 5000 万人民币,由博雍基金领投,恒生电子和索道资本跟投。在这之前,还完成由君联资本和赛富基金 2000 万人民币的 Pre-A 轮投资。
三角兽科技创始团队成员
三角兽的确赶上好时候。公司天使轮融资前后,全球焦点都还停留在 AlphaGo 对战李世石,人机对话的概念一时间引来爆发式关注,直到今天也仍然是人工智能领域的追逐热点。学术机构、科技巨头和创业公司的研究人员都在努力开发能就更复杂的任务进行更详尽对话的「机器人」,无论是做信息检索、房贷咨询还是安排旅行。亚马逊甚至为能开发出进行「连贯生动地」谈话 20 分钟的机器人悬赏一百万美元。「理解别人说什么、写什么,这个潜在的市场非常巨大,甚至比计算机视觉处理还大。我认为,这是我们如何与计算机交互的方式,未来它会无处不在。」深度学习领域著名学者 Yoshua Bengio 也曾有这样的判断。
二
「整个自然语言处理回到核心,就是解决歧义的问题。」亓超告诉机器之能。现在,问答系统技术比较成熟,通常利用知识库、web 和社会关系网络的多种智能体来回答问题。不过,要为用户解决实际问题,系统需要检测到用户意图并决定接下来的动作。只有考虑上下文,把整个对话都考虑进去,系统才能准确提供信息和服务。接下来,三角兽还将与小米智能硬件、百度度秘以及富士康等在开放域聊天和多轮对话等方面展开合作,通过对话技术更准备地匹配用户更加个性化的需求。据亓超透露,公司还有十二个项目同时进行。
「由于之前经历并打磨出市面上两款较为成熟的产品,小冰和度秘在对人机互动系统的理解上相对较深,因此也有很多应用与基础技术的积累。」亓超表示,任务驱动多轮对话系统是三角兽技术优势之一,除此之外,公司的技术优势还体现在开放域聊天和中控系统。
对话系统研究瓶颈之一是缺乏数据,同时也需要采用模拟形式来训练模型。小冰和度秘使用的大部分数据都是网络公开可见的数据,比如,BBS 。三角兽最初的数据来源于微博、天涯等一些开放性社交网站,抓取大量数据后用算法进行清洗。新型自然语言理解平台的兴起有助于真实用户数据收集,并训练只能在现实环境中学习的基本技能。「我们主打方向是检索式聊天系统和 Sequence To Sequnence、端到端的生成式聊天系统。底层技术方面,与小冰、度秘差别不太多,不同之处在于机器学习的语料。」亓超补充道。
具备难以复制的专有数据,初创人工智能公司才会拥有防御力。据了解,目前三角兽拥有 500 亿组人与人之间的对话数据(未标记生语料),从这些语料中清洗出 150 亿,系统学习了大概 70 亿。公司也在数据处理上建立了一套数据处理系统,能很快消化新的语料和数据。「数据是我们的核心资源,数据抓取和建设会是长期重点。」亓超说。
第三个技术优势是中控系统,可以将它理解为「管家」,亓超说。三角兽创始人兼 CEO 王卓然曾是百度度秘中控策略技术负责人,在智能交互、机器学习、垂直领域对话系统方面有十年经验,曾领导建立东芝第一代对话系统。
事实上,从被动响应过渡为主动推荐,创造更新商业模式和更大商业价值离不开中控系统。调度系统可以根据用户意图(闲聊还是问答)调用相应的 Bot 执行相应的任务,技术则涉及到对用户意图的理解,比如对话的管理、领域知识、对话图谱等。
三
当你用拇指大面积按压锤子手机屏幕中的文字时,「Big Bang」会将你按住的那一段落文字全部「炸」开,按照语义智能拆分成易于选取的独立的字和词,由你随心所欲地选择,并可直接搜索、分享和复制。手指粗大、动作笨拙的手机用户不再苦于屏幕上处理文字的尴尬。
「Big Bang」操作界面
这个让三角兽大红的手机功能,是将对话中的一个子模块,即分词以及切断分割技术,提取出来应用到一个场景中。「我们受启发和鼓舞很大,我们会进一步将对话系统中成熟模块和技术拆解出来,与手机系统绑定,实现更多更好的手机体验,同时也将真实场景下的技术迭代带来的收益反馈到对话系统里。」亓超说。
对话系统的训练需要大量的语料进行数据分析。亓超分析称,如果语义技术发展要依赖语音技术成熟,由语音转为文本再去进行数据标注,到时再发展就会来不及。三角兽的解决方法是,寻找一些实际场景,在一些尽量通用或者适配的场景下,主动把子模块训练好,增强整个对话系统性能。
「对话系统是一个复杂的系统,融合了 NLP 各项技术。在这种情况下,三角兽也会拆解出一些模块,不作为整体的一个部分,而是作为一个子模块拆出来,放在合适场景。」亓超告诉机器之能,「就像咱们要炼就强壮的身体,如果需要非常强的胳膊,就锻炼胳膊;要锻炼腹肌,就专门按照某些项目去炼腹肌,各个模块强大以后,整体才是一个比较强大的系统。」
不过,三角兽成立之初,大家也曾迷惑过。亓超告诉机器之能,「到底采取什么样的模式,2B、2C,还是做硬件或者 APP,这些都会讨论到。」最后大家认为,目前 NLP 领域并没有成熟到一定程度,「AI 这种,实打实地说,没有成熟到我可以把它捏成一个任意形状的产品。」作为初创公司,需要取舍。
目前,三角兽向 B 端公司推出 SDK 接口与 API 接口,通过合作探索的方式验证不同使用场景。在对方的产品或平台上去提供语义理解的能力,为它们的平台和技术上做出贡献,双方合力把一定场景中需要用到自然语言处理部分的产品打磨到更完美。
CB Insights 数据显示,近期,人工智能初创公司的数量增加了三千万,但是 90% 以上都是针对企业用户。这类创业公司比消费者型创业公司数量多了将近 10 倍。分析指出,专注于企业对象有三个主要优势:退出时,瞄准的价值创造池大了 40%;更广泛的价值分布意味着更有可能创造出一个十亿美元级别的企业型公司,而不是消费者型公司;企业并购创造的更大价值意味着在 IPO 前的大型并购退出时有更大的选择余地。
「AI 很像一个果树林,不少果子有点泛红或者泛黄但还没有成熟,如果一上来就直接去摘这个果子,你可以认为是一个 2C 模式,看似很容易吃到,但果子是生的,这样团队或者公司很难走下去。不如大家合作,催熟果子。」亓超说。
做出一款好的产品,除了技术知识,还要重视场景。只有技术与具体应用场景比如车载、智能家居、可穿设备结合在一起,才能得到稳定的产品。目前,三角兽探索的垂直场景主要集中在三个领域:企业服务、物联网和泛娱乐。「哪些果树本身接收阳光好,离水源近,那么催熟这颗果树的成本和投入就是可接受的。」亓超告诉机器之能。各个领域中人工智能发展的实际情况,比如现有数据情况等也是三角兽的取舍标准。
语音界面可以克服智能家居领域面临的碎片化问题,成为各种智能家居硬件的标准集成器。三角兽为智能硬件包括手机、电视、车载,甚至一些穿戴设备——像耳机、音箱、智能家居等提供语义解析的技术服务。目前,公司重要硬件合作厂商有小米电视、锤子手机、若琪机器人,后续还会与腾讯与华为有相关合作。
「泛娱乐,这一块儿想象空间很大。」亓超说。重点打造 IP 形象,包括明星,直播主播有机器人帮助他们自动对话,可以获取粉丝忠诚度。亓超认为,娱乐和游戏行业的市场空间和大家消费能力越来越强了,有不错的应用场景。
在企业服务这块主要市场上,金融、媒体以及电商是公司的三个主打方向。数据分析显示,作为降低企业人力成本的垂直细分市场,智能客服对应的市场是千亿规模。在这一领域,三角兽已经与恒生电子、光明网、腾讯、新东方、新世界集团等公司达成合作。
虽然目前专注于这三大领域,但是,行业和领域的跨度比较大。但亓超认为,这些都是必须的。「大家需要在不同场景去做尝试,AI 怎么落地,这种情况是不能依靠别人的经验,要靠自己去趟路。最终缩减成重要的几个方向去做。」亓超表示,「三角兽所希望的,是将现阶段的技术完全暴露出来,使之得到一些反馈,从而将技术进一步优化。」
除了时间,人才也是我们的壁垒和优势,亓超说。
五月,三角兽搬进了新办公室。发展仅一年多的三角兽团队,目前约五十多人,大部分为具有相关工作经验的算法工程师,核心团队的部分人也是亓超的老部下。「基本上,这些工程师都是通过一度、二度、三度的关系进来的,社招的很少。」亓超告诉机器之能。
一家创业公司,如果越早努力构建起混合多项强大技能(比如商业、数据、科学)的团队,市场防御能力就越强。马宇驰是连续创业者,曾在 Viacom、奥美公关、Amway China 负责广告、公关和品牌,在融资、运营和市场方面有多年积累。主要负责战略合作的合伙人何晋,曾任灵境 VR 渠道总监、美团和百度外卖全国大客户部项目负责人。公司会将新一轮融资用于团队扩张、市场开拓和公关方面,预计今年将团队规模扩至 60 人。亓超说,「要想形成竞争壁垒,壁垒不能只有一个,城墙特别牢固,但是有一个门是敞着的,就形不成壁垒,只有周边所有的东西联合在一起,才能形成壁垒。」
谈及未来,亓超说,区别于百度和微软的商业方向,三角兽希望可以做更多上下文、长时记忆、性格定制、情绪识别等更上一层楼的技术实现。
2015 年 6 月,巴黎 Facebook 人工智能实验室的开幕活动上,该实验室主任 Yann LeCun 说:「深度学习的下一大步是自然语言理解,不只是给机器理解单个词的能力,而是理解整个句子、段落的能力。」不过,早在 2014 年,多伦多大学计算机系教授 Geoffrey Hinton 也谈到:「我认为接下来 5 年,最令人激动的领域将会是理解文本和视频。如果 5 年内我们还没有在看过 YouTube 视频后能说出发生了什么的东西,我会感到很失望。」
而三角兽仍走在打造这条「巴别鱼」的路上。