深圳湾 2018-05-10
如果在传统处理器上进行智能应用处理,一小时的语音数据需要一万小时才能完成。人工智能的升级,依赖芯片技术。
钱童心
[谷歌最新一代的TPU处理器的性能比去年发布的第二代版本要强8倍,可提供超过100万亿次浮点运算。而且谷歌第一次引入液体冷却的方法来解决散热问题。]
在上海工作的王勇(化名)近日接到一则推销电话,“卖车险的”。他刚好不忙,于是很绅士地跟这位推销员小姐聊了一会儿,解释了一下自己的情况不需要车险了。末了还跟她说了声“谢谢”。
但是这个看起来普通的电话很不寻常。
在挂掉电话后,王勇收到了一则短信,险些昏厥。短信内容如下:“你好,我是刚才给你打电话的电销机器人小三,我们公司的联系电话是XXXXX,欢迎后期来电咨询。”
时代不同了。你可能被人工智能(AI)骗过,未来你也许也可以用AI去迷惑别人了。有这样一个机器人“小伙伴”,它可以代你向餐厅打电话预订座位;还能冒充你跟熟人调侃、替你回邮件。
这一切正在发生。当地时间5月8日,谷歌I/O开发者大会在美国加利福尼亚州山景城召开。这家硅谷科技巨头再次强调了AI先行的战略。
在这次开发者大会上,谷歌不仅展示了功能更加强大的语音助手GoogleAssistant,还发布了第三代人工智能TPU(张量处理器)芯片,它的前辈就是“阿尔法狗”在围棋界所向披靡的“秘密武器”。由此,谷歌一方面与人工智能芯片巨头英伟达的GPU(图形处理器)形成竞争,另一方面也意在挑战微软和亚马逊云。
一句“嗯哼”脱口而出
谷歌CEO桑达尔·皮查伊在会上演示了事先录好的两段语音对话,分别是语音助手代替人类预约理发和预订餐厅的。
比起传统的对话语音机器人,使用谷歌DuplexAI语音系统的新助手要人性化得多,它不仅能够和人类进行多回合的对话,而且还自带语气词,听起来相当逼真。
在第一段女声版机器人顾客和理发店店员的对话中,机器人顾客的一句“嗯哼”以假乱真,与人类使用英语对话的语气十分相似,而且机器人也不再局限于仅仅以“是”或者“不是”简单地回答提问,而是会与人类进行谈判和商量,最终达成了一致,完成预约工作。
在另一段男生版的机器人顾客和中餐店服务员的对话中,机器人不仅能够听懂带口音和不规范的英语,而且还会在对话中进行即兴发挥,让双方的交互变得更加“优雅”而自然。比如当餐厅服务员告诉顾客当时“不用等位”时,机器人顾客人性化地追问道:“那么一般情况下,等位需要多久?”
皮查伊没有透露这项服务何时能够让用户使用,不过表示从今年夏天起就将进行公测。
值得注意的是,在《爱乐之城》中客串乐手的美国著名歌手约翰·传奇(JohnLegend)的声音也将被谷歌助手采用。包括他在内,谷歌目前已经拥有六种不同的人声。
皮查伊在大会上表示:“谷歌的语音合成系统Wavenet模型是基于原始的音频来创造出更加接近人类、更加自然的声音,包括音高、语速以及停顿等。”
这项技术如果普及,或许意味着未来商家接起顾客的电话时,将很难分辨究竟是真人还是机器人在向自己咨询提问。
中国的人工智能企业出门问问创始人兼CEO、谷歌前工程师李志飞对第一财经记者表示:“这种场景虽然有点耸人听闻,但是与谷歌的竞争对手如以网络书店起家的亚马逊相比,谷歌在最底层的核心技术以及把技术打磨、做细做精方面绝对是‘一骑绝尘’的,这主要受到公司的工程师文化以及强大的研发队伍的影响。”
芯片云端齐发力
谷歌的策略已经从“人工智能优先”(AIFirst)全面转向“独有人工智能”(AIOnly)。除了语音功能以外,谷歌邮箱Gmail也加入了智能化功能,运用机器学习可以在人们输入时实时推荐可能会使用到的短语。该功能被称作“智能创作”(SmartCompose),本月底将会正式上线。
而人工智能在谷歌地图方面的应用就更加强大了,利用全新的GoogleLens的应用,地图和相机直接实现打通,与谷歌街景结合,打通虚拟和现实世界,类似于增强现实(AR)的功能,由现实到虚拟,只要打开相机,就能给你指方向。此外,人工智能还能直接与卫星图像结合,把更多商户和新地址添加到地图中。
“这才是我们真正需要的人工智能。”兴民智通(002355.SZ)首席运营官张人杰对第一财经记者表示,“一些国内公司扎堆儿在做同质化的东西。有时候,产品设计的初心在某种程度上决定了结果。”该公司的主业之一是智能网联汽车数据的采集运营。
强大的人工智能背后是高性能芯片的支持。I/O大会上,谷歌还发布了最新一代的人工智能芯片TPU3.0版本。两年前谷歌首次宣布推出通用的人工智能芯片时,就意在与英伟达的人工智能芯片GPU竞争。
据介绍,新一代TPU能够帮助谷歌提升包括录音音频中的语言识别功能,还能在视频和照片中辨别出物体,并从文字当中提取隐藏的表情。
谷歌已发布两个版本的TPU处理器,公司将允许使用谷歌公有云服务的第三方开发者在TPU上进行开发,从而在云服务业务方面与微软和亚马逊竞争。本周稍早时,微软也发布了基于微软云Azure特殊芯片的早期应用。
皮查伊表示,最新一代的TPU处理器的性能比去年发布的第二代版本要强8倍,可提供超过100万亿次浮点运算。而且谷歌第一次引入液体冷却的方法来解决散热问题。
“把自用的TPU开放出来做云服务,显示了谷歌在云业务方面加大投资布局。谷歌将与所有提供智能云服务的厂商竞争;而芯片方面则将和英伟达展开竞争。”研究机构Gartner研究副总裁盛陵海对第一财经记者表示。
下一个风口:医疗+AI
国内的智能语音领军企业科大讯飞(002230.SZ)也在密切关注谷歌I/O大会的新动向。
科大讯飞执行总裁胡郁对第一财经记者感叹道:“谷歌的语音技术一直挺牛的。”据介绍,一小时的语音数据如果在传统处理器上进行智能应用处理,需要一万小时才能完成,因此科大讯飞一直在跟踪人工智能专用芯片的前沿进展。
胡郁向第一财经透露,科大讯飞看好智能语音在医疗方面的应用。“我们正在和国内的几个医院谈,用我们先进的智能语音技术帮助医生记录下手术的全过程。”通常医生在做完手术之后,要通过回忆把手术过程记录下来留存。胡郁说:“我们让医生在手术过程中戴上耳麦,能实时把他们的指令记录下来,手术完毕后直接汇总成文,为医生减轻了大量整理工作。”
人工智能和医疗的结合将是科技公司下一个争夺的主战场。在印度,谷歌的医疗AI已经在帮助医生进行视网膜筛查糖尿病和心脏病的工作,以解决医疗资源分配不公的问题。
“两年前,谷歌开发了一套神经网络,它能通过眼部医学造影来探测糖尿病视网膜病变。今年,人工智能团队利用深度学习模型,已经能够高度精确地预测一位病人未来心脏病和脑溢血的发病风险。”谷歌5月9日在发给第一财经记者的声明中表示。