刺激2019:从AWS和阿里云看云计算疯狂的一年

longshilincom 2019-12-13

云计算从业者有个不成文的条约:国外看 AWS,国内看阿里云。

怎么个看法?AWS 的 re:Invent 大会 有 6 万多人参加,阿里云的杭州云栖大会有 4 万多人参加。这个比例竟与两家巨头的母公司市值出奇一致——亚马逊 8 千多亿,阿里巴巴 5 千多亿。

每到深秋入冬时节,全球顶级工程师都聚在拉斯维加斯和杭州进行一场朝圣之旅,汲取两位风向标大佬的思考和灵感。

如果说 re:Invent 是开发者的天堂,那云栖大会就是创业者的武林,无论是酷科技文化的天堂还是刀光剑影的武林,都为过去 5 年的云计算划上了一个完整的句号。

上云要趁早、云原生、容器、更大又更小的数据库、全自动 DevOps、雾服务器、边缘计算……这些年我们早已被这些熟悉的字眼包围。

接下来马上迈入的 2020 年将开启下一个五年,两位A姓大佬又给我们带来了什么样的讯号?

  云计算技术下沉:芯片成兵家必争之地

云厂商对算力的需求是无止尽的,尽管服务器市场已经明显转向云厂商,但这阻挡不了云厂商自己搞芯片。毕竟,谁有更强的算力,就掌握了更多的主动权。

AWS 在 2019 re:Invent 大会上推出了基于 ARM 架构的 Graviton2 高性能处理器芯片以及机器学习芯片 Inferentia,前者比 X86 实例的性价比高出 40%。Graviton 一词来自 gravity(引力),意味着芯片从过去的幕后走向前台,成为吸引云计算用户的关键作用力。虽有一代芯片发布在前,但当 AWS 把投入的决心展现给世人的时候,所有人还是觉得虎躯一震:“他没开玩笑”。

其实大佬们早有布局,2015 年亚马逊以 3.5 亿美元收购了以色列芯片开发商 Annapurna,后者拥有强大的芯片设计和开发能力。而阿里巴巴则在 2018 年收购了中天微,成立了平头哥半导体芯片公司。

今年 9 月的 2019 杭州·云栖大会上,阿里云推出了全球最强的 AI 芯片——含光 800。在 ResNet-50 测试中,含光 800 推理性能高达 78563 IPS,是英伟达同类最强产品的 4 倍。目前,含光 800 已经应用在阿里巴巴的视频图像识别、分类、搜索领域,未来还可应用于医疗影像、自动驾驶等领域。

自此,云计算的竞争格局,从早期的 IT 成本之争正式步入今天的算力之争,软硬一体的算力正在成为云厂商的核心竞争力。以后,谁兜里不揣块芯片,出门都不好意思跟人打招呼。

事实上,做芯片是一个关键抉择:如果没有云,直接做芯片只会叫好不叫座。同样,没有自身的场景,如马拉松一样的芯片产业也得不到足够的支撑。最后的难点,才是芯片技术本身。

不管是定制化芯片还是自研芯片,都是在技术下沉通道里寻找新的增长点,为客户带来更强大、更普惠的计算能力。亚马逊、谷歌、阿里不约而同在 2019 年发力芯片市场就是最好的佐证。

虚拟化技术重大突破:翻越云计算的珠峰

云计算与生俱来就带着一道伤疤:一切算力经过虚拟化后都会打折。上汽集团就曾希望用云计算来解决汽车仿真的大算力场景需求,但实测结果让公司大跌眼镜,虚拟化性能损失高达 60%,最终不得不忍痛放弃。

越是密集计算的场景,虚拟化带来的损耗问题越明显,无数企业因此被挡在云计算的大门之外,眼看着新时代的浪潮奔流走远。

从 2016 年左右开始,AWS 和阿里云这两家分别来自西方和东方的科技公司不约而同开始向虚拟化损耗开刀。

AWS 的答案是 Nitro system,阿里云的答案是神龙架构。AWS 的方式是直接干掉 Dom0,阿里云则是设计了独立芯片来专职做虚拟化工作。

一北一南,两支队伍分别攀登珠穆朗玛峰,最终都获得了巨大的成功:受益于 Nitro,亚马逊云在 2019 年新增的 EC2 虚拟机比前一年增加了 3 倍。而神龙则直接支撑了 2019 天猫双 11 这样扫眼天下都找不到对手的庞然大物,体验丝般顺滑,把虚拟化性能开销做到了几乎为零。

上面提到的上汽集团,在 2017 年听说了神龙之后,迫不及待在云上做了测试,相比过去使用传统超算服务,使用神龙超算集群汽车仿真计算效率提升 25%。有了第一个吃螃蟹的人,后面就是纷至沓来——吉利集团也将全部仿真业务在神龙超级计算集群,过去平均排队 2 个月的任务,现在平均 2 周搞定。

IT 市场上已经很久没有看过这样的降维打击了,当 AWS 和阿里云祭出比物理机性能还强的云服务器时,你很难忍住不伸手,况且云还有免运维、易开发等数之不尽的好处。

2019 的杭州云栖大会上,巨龙降临,阿里云推出了第三代神龙架构,性能比上一代最多提升 5 倍。

所有人都意识到,这是一个可怕的“新物种”。未来一旦全世界云计算厂商迭代结束,神龙和 Nitro 节省的计算资源会是一个天文数字。

混合云崛起:企业不过来,云就过去

“你过来啊”,这是《羞羞的铁拳》里沈腾的名场面,也是过去 10 年,云厂商们不遗余力对客户的卖力吆喝。

但是很多客户就是无动于衷,AWS CEO Andy Jassy 认为,云计算只占了全球 IT 整体成本的3%,还有很大的潜力。

想上云、能上云的都已经上了,剩下的都是些难啃的硬骨头。所以“你过来啊!”还得有下一句“你过不来,那我就过去”。

怎么过去?AWS 给出的答案是:混合云。

但混合云的概念早几年就提出来了,为何今日还要重提?在 re:Invent 会上,有个来自 Dropbox 的分享形象描述了混合云部署的难处。

刺激2019:从AWS和阿里云看云计算疯狂的一年

2016 年,原本是忠实粉丝的 Dropbox 离开了 AWS 改为自建数据中心,原因之一是要降低存储成本,第二是要低延时。但后来的事峰回路转,随着 AWS 每年推出的新产品和新特性,Dropbox 又接着用回了 AWS,同时使用自建数据中心与 AWS,并用自己开发的工具链与 AWS 的工具保持了兼容。

这像极了一对异地热恋的恋人,当两者的间距不断缩小到可以忽略的时候,迟早是会擦出爱情火花的。

AWS 是坚定的公有云支持者,坚决反对私有云模式。但在中间态上,AWS 采用了一种迂回战术,例如这次放的大招——AWS Outposts,为客户连接本地数据中心和公有云,以及离经济发达地区更近的 AWS Local Zones,和更边缘的 AWS Wavelength ,这一切都是以公有云为引力中心,把触角伸向企业内部,不失礼貌地微笑说:既然不方便出来,那我把美食打包带去你家吧。

AWS Outposts 的发布可谓教科书式的典范,从在线选配下单到兼容各大厂商的一键配置,每一步都帮你安排得明明白白。

你大爷终究是你大爷,就算和传统厂商贴身肉搏,也穿着体面、面面俱到。

阿里云则更像个江湖侠客,剑法飘逸,放荡不羁、不拘小节,却忠诚心境、深情不移。

早在 2014 年,阿里云就推出了类似 AWS Outposts 的专有云 Apsara Stack。它的路线略有不同,走的是农村包围城市策略,从群众中来、到群众中去,是企业中最懂云计算的,也是云计算公司中最懂企业的。

到了 2019 年,阿里云加大了混合云推进力度,展示出了“前所未有的硬”和“柔情似水的软”,陆续推出了 POLARDB 数据库一体机、CFPS 存储一体机、边缘计算服务等,还与 VMware 合作,对外开放 API,支持被第三方集成。

在公有云视角下,把企业本地计算、存储、大数据等部分环节,通过公有云对云上云下的统一管理,以满足脉冲计算、基因计算、AI 与机器学习等新型计算需求,这就是阿里云的混合云思路。

阿里云不像 AWS 那般面面俱到,但对国内很多场景单一的公司来说,可谓雪中送炭。就是这些小帮助企业解决管理、运维、效率问题,统统解决了,企业就在不知不觉中上云了。

  结语

过去 5 年,我们看到了云计算对这个社会产生了深远的影响,从 12306 到城市大脑,从人工智能到工业互联网,都在云上诞生了无数的创新和无限的可能。

越来越近的 2020 年将开启下一个 5 年,风风火火的云计算会怎么走,时间会给我们答案。

克里斯托弗·诺兰在《蝙蝠侠前传》三部曲里写到,一个对社会漠不关心的人,不可能会投入半数财产来拯救世界。

相关推荐