visionarywind 2018-05-18
摘要: 弹性裸金属服务器服务于市场的技术概要分析
伴随着公有云的高速发展,混合云打通客户线下专有云和线上公有云资源的需求日趋强烈。Open stack和VMware等IaaS stack在公有云部署,同时管理客户线上和线下IaaS资源。
可以看到,VMware cloud on AWS就属于此种混合云业务应用场景
而Open stack和VMware cloud等IaaS stack在公有云部署,最为关键就是要求公有云暴露CPU虚拟化能力,否则在普通虚拟机中部署嵌套虚拟化技术,性能完全无法接受。
具体到intel X86 CPU体系,则要求公有云平台把计算资源的完整虚拟化特性(intel VT-x和VT-d等硬件虚拟化技术)对外提供,使得VMware ESXi, KVM, XEN, Hyper-V等虚拟化平台和技术能够平滑上云
容器技术具备轻量敏捷等技术优势,正在成为Devops主流技术。相对于公有云VM部署容器,使用弹性裸金属服务器部署容器具备零虚拟化开销等性能优势。
同时我们注意到clear container, RunV,以及Kata container等具备高隔离安全特性的新型容器技术,依赖CPU完整虚拟化特性(比如intel VT-x)。此种高隔离高安全容器技术只可能部署在弹性裸金属服务器
所谓高质量计算服务,是指零资源争抢、零虚拟化开销,和高隔离安全
1) 零资源争抢
虚拟化技术在提高数据中心资源利用率同时,也引入资源争抢等业务难题。考虑多个VM运行在一台物理服务器之上:CPU core、L1/L2/LLC cache、内存带宽等CPU和内存子系统资源通过虚拟化技术抽象和切分,同时提供给多个VM使用。上述CPU和内存带宽在VM间的资源争抢很难根本解决。
2) 零虚拟化开销
虚拟化技术必然带来性能开销,而弹性裸金属服务器不存在CPU和内存虚拟化开销
3) 高隔离安全
弹性裸金属服务器是真正意义上用户独占,诸如hypervisor逃逸、CPU微架构侧信道攻击等问题天然免疫
RDMA网络在超低时延和减轻CPU负载等方面优势明显,但是在网络虚拟化支持方面的短板明显;而公有云网络部署的关键是通过网络虚拟化达到网络资源的租户隔离。而弹性裸金属服务器在支持原生ROCE和IB RDMA网络方面,具有天然优势。
因此可以看到各家云厂商均以裸金属服务器支持RDMA网络,以此部署HPC和异构计算的高速低时延互联需求
传统来讲,intel x86体系结构对CPU虚拟化技术等软硬件支持最为完善,加之intel XEON x86处理器在服务器市场的垄断市场地位,主流公有云IaaS虚拟化技术均基于intel XEON x86。
但是必须看到对于特定细分市场,RSIC CPU仍然具备相当优势。比如Power ISA CPU在金融保险等市场的优势地位,以及ARMv8 ISA在新兴服务器市场崭露头角。如何支持Power和ARMv8等RISC服务器,是公有云厂商必须回答的问题
弹性裸金属服务器无需CPU和内存虚拟化技术的特别适配,能够使得Power和ARMv8等处理器快速公有云上线部署
诸如Nvidia 1080Ti等GPU,其对虚拟化技术支持有限,通过虚拟机方式输出GPU计算性能,会有严重性能下降;而弹性裸金属服务器可做到GPU性能无损输出