Ezenwang 2019-11-12
引言:
融云成立于2014 年,聚焦互联网通信云赛道,专注为开发者和企业客户提供即时通讯和实时音视频通信云能力。融云团队在即时通讯领域拥有十余年的技术研发和运营维护经验,11 月 30 日上海,融云首席架构师李淼将在 2019 全球互联网通信云大会(简称:WICC)分享《全球通信网络架构解析》。InfoQ 记者近日采访了李淼,提前揭秘其背后的技术亮点。
互联网通信云是以云计算技术理念和服务模式提供的IP 通信能力,在互联网应用、企业级应用和智能硬件场景中有广泛应用。可以说,中国云通信领域的基石已经奠定完毕,随着国内移动应用领域出海的热潮,以及国内定制化 IM 市场空间的不断扩大,中国的云通信领域已进入快车道发展阶段。
据第三方报告显示,在相对成熟的公有云市场占有率方面,无论是业务量还是用户量,融云均遥遥领先。从2017 年开始,融云着手打造全球通信网络架构,并在不断加大对海外市场的技术投入,目前全球总触达用户达 40 亿,成绩颇为亮眼。
融云打造全球通信云网络的契机
首先简单介绍下融云的业务逻辑:融云将复杂的互联网通信技术封装成SDK 供全球开发者下载使用,并向开发者提供平台环境、技术支持以及后期运维等服务,使开发者的业务能够快速获得 IM 通信能力,实现单群聊、聊天室等功能,采取语音、文字、视频、图片等多种形式,满足社交、直播、电商、在线教育、游戏等不同场景的需要。
随着中国移动互联网出海步伐的加速以及跨国公司全球化经营的展开,融云在美国、东南亚等多地设立数据中心,并在全球多地拥有3000 多个加速节点,逐渐构建起覆盖全球 233 个国家和地区的互联网通信云网络。融云的全球化战略分为三个阶段,即夯实产品质量基础、服务中国开发者、服务海外开发者。通过调研知名云服务厂商并严格选型,融云选择 AWS 等多家供应商,并同 Akamai 等CDN 服务商合作提高消息的“最后一公里”到达率。同时,融云针对复杂的海外网络和设备环境制定了一整套监控解决方案,其全球通信加速网络提供多条可选链路,通过自动切换,有效解决客户在跨地域通信中面临的延迟、丢包等问题。自 2017 年启动全球化战略以来,融云的海外业务增长迅速,服务于昆仑万维、APUS、百度国际等著名国内外企业。
李淼提到,融云打造全球通信云网络的初衷其实是源于客户的需求。最开始融云有一家客户是专门做全球旅游的业务,他们希望融云对于其App 在海外的通信能力上提供一些保障。但是当这款产品做出来以后,让融云技术团队发现了“新大陆”。反向来看,其实有更多的用户,对于全球链路的通信保障是有需求的,于是融云将全球通信网络打造成了一个平台。
整个网络平台搭建完成后,主要经历了三次比较重要的架构迭代。最开始时,从技术的角度来看,大部分都是一些工程手段,比如通过网络代理等,只是为了满足少量客户的需求。随着客户量的增加,用户数量也越来越大,之前的技术手段对于后续的扩展、管理,甚至是数据存储等,已经不具备优势了。在2017 年初,融云对其全球通信网络进行第二代整体架构的升级,升级之后的架构支持私有云、多数据中心,以及动态链路切换等。近期,融云又对全球通信网络链路分配的准确性做了一些优化。
李淼提到:“我在这个行业已经十多年了,我们的核心团队来自飞信和三星中国研究院。从一开始以 IM 为核心业务,到现在,不断加大功能运用的广度,同时在音视频领域不断发力。在基础架构层面,融云的服务端、PC 端、移动端所采取的技术都代表着国内的领先水平,对标其他平台的优势也很明显。”
在安全性技术方面,融云采用协议名称为EverSync 的私有通讯协议,数据在通信过程中不采用明文的形式,具备防篡改能力和防劫包重发的能力,是行业中唯一一家公开向客户承诺消息不丢、不重、不乱序的企业。
设计全球通信云网络的要点
李淼提到:“客户的诉求就是整个系统最大的痛点。目前与各类客户接触后发现,大家的痛点主要集中在三方面,即消息的准确性、系统容量和可靠性。”
关于准确性,其实从国内来看,大家一直有一个比较明确的参考依据,就是微信。李淼提到,“融云如何做到消息的准确性,这是我们一直在不断优化的地方,并且我们在实践中也会通过一些技术手段和机制保证消息传输的准确性。” 在即时通讯领域,十分突出的跨越式创造其实很困难。即时通讯存在很多年了,它的发展已越来越接近最佳实践,所以后续的一些迭代更多的是在功能上的创新和优化。
在系统容量方面,融云目前SDK触达用户已经超过 40 亿,平均每天的消息量在 150~200 亿,最高峰值超过 2000 亿。这是如何实现的?李淼介绍,第一,平台的无限扩容。对于融云平台而言,它的架构支持服务器配合容量进行不断扩容。在服务器不够的情况下,可以增加服务器;单个数据中心容量不够的情况下,通过添加第二或第三数据中心的方式,扩大数据中心的容量。 第二,在系统设计上,运用了很多优化的手段,使得系统内部可以进行更加高效的信息传递。第三,优化数据存储方式,使整个平台可以支撑大量消息的存储。
在可靠性方面,融云除了采用常规的手段,如服务器的冗余,数据的冗余,链路的切换,数据中心之间的灾备等来保护系统的安全。此外,融云也做好了故障迁移工作,在出现故障的情况下可以将之前的业务全部迁移。
还有一点是关于全球加速网络,李淼解释:“用户的最终数据可能汇聚在一个地方或者两个地方,那么他接入数据中心的方式可能不是直接接入,而是通过边缘加速节点,也就是通过加速代理的方式连入数据中心,这样的网络我们称之为加速网络。”
融云在加速网络的建设上有哪些技术亮点呢?
第一,对于用户边缘节点的选择,采用了相关的技术能力,使用户链路与边缘节点的选择更加准确。
第二,节点之间的数据传输,首先会通过物理链路的方式进行优化,在物理链路满足不了的情况下,会通过国际链路进行优化,从而保证数据传递的实时性,进而提高整体数据传输的质量。
第三,融云通过智能平台可以动态地做一些数据边缘节点的规划。比如,最近英格兰的用户集中访问的边缘节点可能比较多,数据也比较多,在这种情况下,可能会优先在英国创建节点。
全球通信云网络的未来规划
首先,融云会在全球继续扩增覆盖的通信节点。第二,在一些无法覆盖的地方,与其他合作伙伴共同搭建网络。李淼提到:“融云现在也有这样的客户案例,他们的服务器在北京,而客户群主要分布在国内跟欧洲两部分,之前如果没有融云的网络加速,欧洲的客户体验会非常差。当使用了融云加速系统后,整个用户体验发生了质的转变。除此以外,我们还跟很多世界 500 强的企业合作,也会给他们提供一些终端网络加速的功能。比如,客户的服务器在国内,但是其员工遍布全球。我们也会对他们的网络做一些特定的优化。现在部分地区比较偏远,我们可能覆盖不到,但是其他合作伙伴如果有一些途径可以触达,我们非常愿意加入其中。融云的平台本身并不是一个完全闭合的平台,而是兼容一些其他厂商的能力,这样可以让我们的业务拓展得更快,网络覆盖点更多。”
随着机器学习、NLP 等技术的逐渐成熟,融云也陆续在业务中引进这些技术,提前做一些前期的技术准备。李淼提到,在即时通讯平台,目前对于机器学习或 NLP 技术的应用不是很多,“我们更多的是在垃圾数据过滤、数据分析、网络动态处理等方面应用一些新技术,提高处理效率。”
在5G时代,即时通讯如果单纯只是传递一些文本、图片或者语音消息,其实并不能体现出 5G的优势。未来 5G 更大有可为的应用主要是体现在音视频的通信上,甚至可能包含一些技术设备,例如 VR、全景通信等。现在对于 5G 来讲,大家都处于一个探索阶段,5G 的路已经铺好了,场景需要大家来探索。融云内部也在探讨如何发挥 5G 的优势,李淼说:“我们也非常期待。”
活动推荐
11 月 30 日上海,2019 全球互联网通信云大会将邀请业内顶尖技术大咖,全方位解读通信云领域的前沿技术与实践经验,为全球开发者和业界技术领袖提供面对面交流的机会,有干货、有实践,就等你来!