阿里Aiqudo:用语音技术将深度链接「进行到底」

AI启蒙研究院 2017-08-08

Aiqudo 诞生于 Quixey 的余烬。这些创业者们仍然认为现在人们夸大了语音助手,也忽视了实际存在的和可能存在的问题,他们正从语音技术角度反思 Quixey 的应用程序搜索概念,试图开发一款并非直接面向用户、打通不同平台的应用程序的语音助手。尽管碎片化的未来最终需要一种标准,但距离自己的梦想,Aiqudo 还有很长的路要走。

作者 | Jeff Dunn

来源 | Business insider

编译 | 张震、微胖、邱陆陆

所有的科技公司都想听到你的声音。

如今,能预报天气、播放音乐、管理日程的虚拟助手成了赌桌上的筹码。苹果 Siri, 亚马逊 Alexa, 微软小娜, Google Assistant, 三星 Bixby 已经入局,还有一些也在赶来途中。这些虚拟助手被部署到手机、音响、汽车、冰箱、耳机里,而且不久以后还可能出现在增强现实设备中。

每一个应用案例的基本目标就是减少触控。这样,语音助手以及打造他们的公司就变成用户接触信息的滤波器。

但是,John Foster 认为这里有个问题:每一个入场的玩家都在建立自己筒仓(silos)。

「语音的方式正在成形,特别是亚马逊的,也包括绝大多数其他玩家。大家似乎正在试着建造自己的花园,还筑起围墙。」Foster 说,「亚马逊希望你沉浸在他们的体验中。无论何时何地,只要你想购物,亚马逊希望自己都在。这很棒,超级方便。但是,你只能在亚马逊上买东西。一切操作都通过 Alexa,这就是他们包围消费者的方式。」

阿里Aiqudo:用语音技术将深度链接「进行到底」

亚马逊 Echo 使得 Alexa 成为美国家喻户晓的名字

Foster 是 Aiqudo 的 CEO,这是一家位于加州圣何塞的初创公司,只有 20 来名员工。公司名字看似很蠢,但背景复杂。上月末,这家公司推出一种「半隐蔽(semi-stealth)」模式;三月成立后,在 A 轮融资中,获得来自 Atlantic Bridge Capital 的 520 万美元投资。公司已经收购了一家将机器学习用于数字广告业务的爱尔兰初创公司 Sophia。

宽泛地说,Aiqudo 希望用户仅通过声音就能使用任何一款应用程序完成相应的任务。公司有一款叫 Q Actions 的应用程序, 你可以在 Google Play Store 和 Alexa Skills Store 下载到 Beta 版。(该公司称,iOS 和 Google Assistant 版也在认证当中。)

核心层面,Aiqudo 技术的工作方式与 Siri 或 Alexa 类似:利用语音寻找信息。但是,这家公司并不是真要打造另一款直接面向消费者的语音助手。

相反,Aiqudo 主要是想把语音技术卖给那些想要让自己的应用程序变成语音可控的第三方开发者们,他们不想再受 Alexa、Google Assistant 以及其他个人语音助手平台各自为政之苦。公司也想将语音技术卖给那些想将语音控制嵌入自己设备(比如通过 Home 键)中的手机制造商。公司计划在今年夏末生产一款软件开发工具包。

Foster 表示,Aiqudo 正在与「安卓 OEM 商排名前十的四家公司」就潜在合作进行洽谈,但他拒绝提供更多细节。

架起一座桥梁

Aiqudo 看到的市场痛点是,为了按照自家的条款把控市场,诸如 Alexa 这样的语音助手正在妨碍自身功能的发挥,特别是在手机上。让第三方开发者为不同平台打造「功能」的做法很低效,Foster 说,当手机上的应用程序已经可以做任何你要做的事情,他们所需的仅仅是语音启动。」

「开发者不得不为 Alexa 打造一款功能,」Foster 说。「Uber 不得不创建一个 Alexa 功能,Spotify 也需要如此。我们想说的是:就用你的应用程序吧。」

Q Action

类比一下移动互联网:手机不能直接连接到 LTE 网络;你需要首先和 Verizon, AT&T 和其它运营商签订协议,然后获取服务。语音技术之间也存在类似的平台之争。现在,Alexa 与绝大多数应用程序和设备开展合作,但是,智能手机上的使用仍然很有限。Google Assistant 虽然不存在这个问题,但是并没有得到第三方开发商的广泛支持。如果是苹果手机用户,就只能将就 Siri。

每个助手都在不断完善中,但是,无论使用哪一个,在功能上都存在瑕疵。是否以及何时完善,最终都会将更多的控制权交到少数几个巨头手中。

Aiqudo 想要解决这个问题,至少是在手机端。他们的办法就是让每个应用程序变成语音可控,而不需要几款主要语音助手的帮忙。换句话说,他们想出售的是一座桥,赋予应用程序语音控制功能并将这些应程序与各种语音助手平台连接起来。如果一款应用程序加入 Aiqudo 平台,那么,就等于被赋予了语音控制功能(只要是可以获取 Aiqudo 技术的地方。)

具体实现方式是:让那些应用程序登陆平台,在应用程序中将不同触摸输入序列映射到某个语音命令。通过直接分析你设备上的应用程序,据首席技术官 Rajat Mukherjee 称,Aiqudo 可以执行这些应用程序的「动作」;无需类似 Alexa, Google Assistant, or Siri 那样的定制化支持。Mukherjee 说,这些动作不一定要和某个具体应用程序关联起来。Aiqudo 正在试图研究无需说出应用程序的具体名字,就能启动某些动作。

比如,如果你要打车回家,无需特别指明是使用 Uber 还是 Lyft,只需要说「我要打车回家」,理论上 Aiqudo 的技术就能识别你所使用的打车软件,获得有关目的地信息后为你叫车,不需要你触摸任何东西。如果你安装了 Slack,你可以说「打开主界面,」它就会打开应用程序,进入该界面。在这个意义上,类似一个自动化的 IFTTT「小应用程序」。

阿里Aiqudo:用语音技术将深度链接「进行到底」

设备上的「Q」chat head 代表 Aiqudo 的当前应用程序

Foster 认为,对于那些想要通过语音命令而变得可用、但又不想费力使用当前的语音助手的应用程序来说,他们的技术特别有用。

Foster 说,「我使用 Surfline 查看浏览量——差不多 200,000 的下载。我认为,这不会成为一项 Alexa 的技能。因此,只要无法通过 Alexa 进入这个应用,Alexa 就无法实现『Alexa 无处不在』的愿景。因为现在查看浏览量,我仍然不得不使用 Surfline。」

最终目标就是让语音控制正好位于手机界面顶部的那一层。

拼接碎片

坦白来说,Aiqudo 还有很长的路要走,即使想要接近这一目标都不是一件容易的事。说实话,一家成立只有五个月的公司,想要叫板亚马逊和谷歌绝非易事。

然而,Aiqudo 的来头确实值得一提。很大程度上,这家公司建立在 Quixey 的余烬之上。后者是曾是硅谷宠儿,据报道市值曾达 6 亿美元,但在今年早些时候「熄火了」。Quixey 致力于应用程序之间的「深度链接」,让用户可以在应用程序中搜索信息,并实现不同应用程序间的跳转,就像不同网站之间的切换。

阿里Aiqudo:用语音技术将深度链接「进行到底」

这个设想为它赢得软银以及阿里巴巴等大公司的投资。公司全力实现的技术(主要是在云端模拟应用程序)的过程中,与阿里巴巴(主要的支持者)的关系也出现争议。不和最终导致阿里巴巴在三月份关闭了 Quixey 的业务。

作为第三任也是最后一任 CEO,Foster 上任时就背负了 Quixey 的一系列问题。但是,当公司命运已成定局时,他和曾为谷歌、雅虎产品经理的 Mukherjee 决定,从语音技术的角度反思 Quixey 的应用程序搜索概念。(Foster 反复强调,该公司使用了新的 IP 来做这个事情。)

曾是 Quixey 投资者的 Atlantic Bridge 鼓励他们重新开始。他们使用资金重新雇佣了一部分 Quixey 员工。目前,这些员工占 Aiqudo 团队人数的三分之一左右。

亟待克服的困难

Foster 和 Mukherjee 表达了他们对今天过度夸大的语音助手的担忧,包括实际存在的和可能存在的问题。比如说,当我测试 Alexa 与 HTC 合作的 U11 手机新品后,我发现自己只能在亚马逊自己的流媒体服务中播放音乐,这实在是令人抓狂的事。从理论上来说,如果使用 Aiqudo,只要简单地说一声「播放音乐」就行,根本不用担心兼容性的问题;我的手机会知道我想让它做什么。

但是,Aiqudo 的发展壮大同样面临着障碍。首先,目前 Aiqudo 应用程序名气不高。第二,虽然目前只是在测试阶段且 Aiqudo 的目标并不是直接面向消费者,体验仍然比较粗糙。你必须手动输入一个类似于 Messenger 一样的「chat head」来启动命令,坦白来讲,这就与「解放双手」的想法背道而驰了。在解读「自然语言」指令方面同样存在各种问题。

比如,我说「我想看 Youtube 视频」,出现的却是 Facebook 的视频界面。还有一次,我说,「头条新闻是什么」,它却立即下载了 NBA 的应用程序。很多可以使用的「自然」指令也不是完全有效。仍然需要解决某些句法问题。

就算上述问题都得到了解决,还有一个大问题:亚马逊、谷歌和其他各家大语音平台是否会发展得足够好,以致于用户可以忽略围墙带来的问题。Alexa 已经与许多主流应用程序合作,亚马逊也在向使用这一技术的新开发商支付费用。而拥有安卓的谷歌自己就开发了几款极受欢迎的应用程序,给 Google Assistant 提供了大量实测机会。由于苹果公司对 iOS 系统控制得较紧,几乎不可能看到任何非 Siri 语音技术出现在其平台上。

通过 Aiqudo Q 使用 Alexa 调动应用程序

一个更加直接的问题:获利问题。虽然语音不像划触摸屏一样费力,但是在公共场合对着智能手机大声说话依然是一件令人尴尬的事情。

语音指令的另一个可能的应用场景是在增强现实和虚拟现实设备上。Mukherjee 说,Aiqudo 的技术使 Oculus Rift 或者苹果手表上的「应用程序之间的竞争变得公平。」该公司目前仍主要关注移动设备。

碎片化的未来

Aiqudo 能否让人们产生足够的兴趣采用它的技术,仍然是个未知数。但不可否认的是,它的存在本身就是一个有趣的思想试验。

语音助手正融入到越来越多的领域。Parks Associates 公司研究分析师 Parks Associates 称,从 2016 到 2017 年,智能音箱市场预计增长 60%。未来,语音技术开始走向常态化,甚至超过触屏的使用。如果一些应用程序和设备仅仅支持一种助手而其它的应用程序和设备支持另外一种语音助手,会出现什么问题?如果 Alexa 在市场占据主导地位,是否意味着亚马逊可以决定你应买什么设备,应该去哪家店购买?是否等于又制造了一种平台之争——安卓和 iOS,哪个平台最适合语音技术?i

「我认为,随着物联网变得愈加庞大,当前的语音助手模式是不现实的,」eMarketer 的分析师 Victoria Petrock 说道,「因为总有一天会出现这样的窘态:你不得不买一台和 Alexa 兼容的洗衣机、然而你的其他设备全都来自谷歌。」

即使 Aiqudo 的应用改进方式并非万能钥匙,但是语音控制更加自然(并非只有一家公司在单打独斗),允许不同语音助手以某某种方式彼此交流也会减少用户的愤怒情绪。

IDC 分析师 Tom Mainelli 称「如果语音变得极为普遍,技术产业最终需要设置一些标准,正如我们对网络设立标准一样。没有标准,进步会变得缓慢。」

相关推荐