深度剖析Amazon AI技术应用和战略布局: Alexa篇

leadseczgw0 2019-01-16

深度剖析Amazon AI技术应用和战略布局: Alexa篇

Amazon超过微软成为全球市值最高的公司,市值7900万美元。Jeff Bezos一直有个非常著名的“Day 1”哲学,就是让公司永远保持在一个"Day 1"的状态,他认为一旦到了“Day 2”,就意味着进入停滞期。那如何保持“Day 1”?Jeff在2017年给股东的公开信中提到了4个策略:用户至上(Amazon内部神一般的教条),抵制形式主义,关注外部趋势和快速决策。

Jeff早在1997年Amazon还刚起步的时候提到”Day1”,当时的vision:But this is Day 1 for the Internet and,if we execute well for Amazon.com. Today, online commerce saves customers moneyand precious time. Tomorrow,through personalization online commerce well accelerate the very process ofdiscovery。从网上书店起步的Amazon,Jeff已经很早预测到技术对驱动业务发展的重要性——1998年推出的协同过滤推荐引擎充分体验了这一点。

这就是Amazon为什么在“Day1”就对机器学习和人工智能非常的重视,从面向消费者的语音助手Alexa,showcase的无人商店Amazon Go,到藏在电商王国背后的AI技术,从inside到outside,从topdown到bottomup,AI渗透进Amazon内部每一个细胞。

深度剖析Amazon AI技术应用和战略布局: Alexa篇

相对其他巨头,Amazon在AI领域的收购稍显保守,但Amazon Alexa基金就非常aggressive,后面会作介绍。2013年,收购英国公司Evi Technology,该公司当时开发了一款跟Siri类似的语音助手Evi。据了解,Amazon Echo的语音技术来自于Evi。2016年,收购做图像识别的华人初创公司Orbeus,这是目前AWS上提供计算视觉服务Rekognition的前身。同年9月,收购聊天机器人平台Angel.ai,显然是为Alexa布局。2017年,收购AI云服务安全公司Harvest.ai,就是目前AWS推出的支持ML技术的安全服务Macie。

深度剖析Amazon AI技术应用和战略布局: Alexa篇

Amazon的AI应用可分为三大类,一类是能“看得见、摸得着”的前沿技术moonshot产品,像Alexa, Amazon Go和无人机Prime Air;一类是“不可见、藏在后台”的AI技术,如推荐引擎、仓库机器人和fulfillment中心的“最后一公里”;另外就是企业级应用AWS云平台,提供AI工具和服务,让企业构建自己的AI应用。

下面会分为3篇文章,全面、深入地剖析Amazon的AI技术应用和战略布局。

深度剖析Amazon AI技术应用和战略布局: Alexa篇

深度剖析Amazon AI技术应用和战略布局: Alexa篇

Amazon在2004年成立Lab126, 专注于硬件产品的研发。实验室曾有4个神秘的项目,代号为”ABCD”。拥有3000多名研发人员的Lab126以2007年发布的Kindle一战成名。但后来却因重压赌注的智能手机Fire Phone的失败而大规模重组,项目C(据说是AR产品)也随之流产。但万万想不到,一直不受重视的项目D,竟然打了一场漂亮的翻身仗,成为Amazon历史上第二个成功的硬件产品。

深度剖析Amazon AI技术应用和战略布局: Alexa篇

2014年Echo从Lab126孵化出来,先定位Prime会员做市场试水,直到2015年在美国地区开放给全部用户,接着就一发不可收拾,高歌猛进。凭着快速的语音响应,多场景的语音交互能力,亲民的价格,瞬间秒杀市场上的音箱产品。Echo从“点”到“面”的铺开战略,从音箱到家电,从家庭到汽车,全面占据消费者的生活场景。Amazon最新对外公布,Alexa的设备超过1亿。虽然一直处于亏损状态,但这并不阻挡“Alexa Everywhere”的战略。靠硬件盈利并不是Amazon的目的,布局才是大棋。这跟当年AWS“低价切进,闪电式占领市场”的策略如出一辙。AWS开始target中小型企业,财务上一直亏损,但市场渗透极深,等竞争对手开始醒觉的时候,已被AWS抛离到很远。另外,Alexa最杀手的大招是开放,允许第三方的技能集成,吸引了大量的开发者进入生态。2018年,Alexa技能个数已超7万。

深度剖析Amazon AI技术应用和战略布局: Alexa篇

这是一个典型的Alexa驱动开灯的场景。当用户发起语音指令,传给云端的Alexa解析和处理。Alexa如果发现使用的不是它内带技能,就会去调用外部第三方开发者的技能,最后发出“开灯”的指令。

深度剖析Amazon AI技术应用和战略布局: Alexa篇

Alexa主要通过2个核心服务连接开发者和消费者构建生态: AVS (Alexa Voice Service) 和 ASK (Alexa Skill Kit)。AVS让设备厂商把Alexa的“智能大脑”内嵌进自己开发的设备里,让Alexa“无处不在”。而ASK提供工具和接口给第三方开发者添加定制化的Alexa技能,让Alexa“无所不能”。另外,Amazon近期还推出连接工具箱 ACK (Alexa Connect Kit) ,允许设备制造商不联网、不走云端、不需开发技能,通过本地连接就可实现设备“智能化”。很明显,Amazon这些布局极具前瞻性,不但笼络了消费者和开发者,还降低技术门槛让传统的硬件制造商进入生态。它的最终目标是让Alexa无处不在,无所不能,统治从家居家电,消费级可穿戴设备到汽车的一切平台。

深度剖析Amazon AI技术应用和战略布局: Alexa篇

我们从技术层面drill down,对Alexa的处理流程进行拆解。AVS主要负责两个转化:语音转文字(Speech-to-Text)和文字转语音(Text-to-Speech)。这两个转化的背后是由两个深度学习引擎所支撑:Amazon Lex和Amazon Polly。

1. Amazon Lex:语音转文字服务,包含自动语音识别ASR和自然语言理解NLU的功能,可以独立于Alexa使用,是Amazon AWS对外提供的chatbot服务

2. Amazon Polly:文字转语音服务,利用的是语音合成技术(speech synthesis)

首先,AVS解析用户发起的语音请求,识别技能的名称,转成结构化的信息。如果技能已经部署在AWS,ASK就直接运行AWS Lambda服务。AWS Lambda是云计算Serverless的计算架构,函数即服务(Function-as-a-Service, FaaS)。简单的来说,就是开发人员直接编写运行在云端上的函数,后面AWS章节会详细描述。如果技能不在AWS,ASK就通过REST API调用外部服务。返回的结果通过AVS转成语音信息传给Echo,或者图像形式发送到手机App。

深度剖析Amazon AI技术应用和战略布局: Alexa篇

Alexa的成功主要在产品、市场先机和开放策略。先从Echo单点爆发,迅速占领市场,形成第一道“护城河”。然后,利用开放的策略,吸引更多的开发者研发第三方的Alexa设备,满足消费者各种场景需求,用户体验不断提升,然后带来更多的流量,吸引更多的开发者进入,打造一个自给自足的生态循环,形成第二道“护城河”。另外,生态的增长,持续产生大量有价值的用户偏好数据,数据的反哺帮助ML算法优化,分析更加精确,个性化程度更高,客户的体验更好,形成第三道“护城河”。从用户流量,到开发生态,到数据反哺,持续优化模型,层层递进,形成一个让竞争对手难以复制的巨大壁垒,最终垄断市场。

深度剖析Amazon AI技术应用和战略布局: Alexa篇

Amazon在2015年成立1亿美元的Alexa Fund,2017年再加注1亿美元,target全球更多地区(美国、加拿大、澳新、印度等)。基金目的主要是围绕Alexa打造智能助手的生态,让Alexa植入到更多的外部第三方产品,开发更多技能,引入先进的语音交互,NLP等AI技术。基金除了关注ToC应用,还会进入ToB领域,这跟逐渐从消费级转型到企业级的微软Cortana正面交锋。

除了基金,Alexa跟知名加速器Techstars合作,孵化以语音技术驱动的创业公司。据了解,Amazon与Techstars向每家加速器创业公司投资12万美元,换取6%的普通股。另外,基金还与大学,如卡内基梅隆CMU,Johns Hopkins,南加州大学,以及加拿大的Waterloo等,合作创办fellowship项目,争取从更早期阶段孵化语音AI技术。

深度剖析Amazon AI技术应用和战略布局: Alexa篇

基金的portfolio有3家来自加拿大,7家来自欧洲,1家来自以色列和1家来自印度,其他均是美国地区。领域覆盖了智能家居,汽车出行、教育、医疗护理、企业应用等领域。很明显,智能家居仍然是Alexa的重心,从智能冰箱贴,宠物喂食器到安防摄像头,共投了14家。其中智能门锁Garageio,智能门铃Ring,安全路由器Luma,智能洒水系统Rachio均被收购。儿童教育也是Alexa的关注领域,结合语音技术和IoT,赋能儿童STEM教育。核心技术和平台方面,KiTT.ai 专注语音唤醒和自然语音交互技术,尤其定制化的热词检测和支持多回合、多平台的语音会话技术,2017年被百度收购。DefinedCrowd针对的是语音识别,NLP和计算视觉方面的数据打标签和训练服务。还有明星公司Ctrl-Labs,同时获得GV,Matrix Partners,Peter Thiel的Founders Fund等知名风投的投资,结合计算神经科学,机器学习,生物物理,人机交互等技术,打造新一代的“脑机接口”。另外,Alexa也进入ToB领域,包括销售场景的Tact.ai、零售场景的Blutag、餐饮场景的SeverRooms。

深度剖析Amazon AI技术应用和战略布局: Alexa篇

80到90年代,微软的Windows一直稳坐PC操作系统的王者地位。从2000年开始,移动互联网开始崛起。2007年是一个关键里程碑,Google推出免费操作系统Android和Apple发布iPhone,标志着正式进入移动互联网时代。虽然两家走的路线不一样,一个开放操作系统以应用生态为主,一个封闭走中高端路线,提供极致的用户体验,但并不阻挡iOS和Android的发展势头,完全占据了用户手机使用的半壁江山。2015年,Echo横空出世,以极快地进入智能家居市场,从点到面地爆发。通过精准的产品定位,

闪电式的市场策略,开放的生态,以及投资布局,建立极高的竞争壁垒。得用户者得天下,Amazon目标只有一个,就是打造下一代基于语音交互的操作系统。

相关推荐