yangjianren0 2017-08-14
今天是AMD发布新一代RADEON RX VEGA64显卡的日子,在此之前我们先说点题外话——上周五NVIDIA发布了截至7月30日的最新季度财报,当季营收22.3亿美元,游戏GPU业务贡献了11.9亿美元,同比增长52%。对比之下,AMD前不久的Q2财报中,营收12.2亿美元,但这是包括CPU、GPU、GPU及主机订单在内的全部营收,与NVIDIA差距早已被大大拉开了。
不论是营收还是盈利,NVIDIA这几年的日子可比AMD滋润多了,其中很大一个原因是AMD缺少拳头产品,处理器和显卡两个产品线皆是如此。好在今年AMD缓过劲来,推出了Ryzen系列高性能处理器,在显卡市场上也陆续发布了多款VEGA 64新品,现在发布的则是游戏玩家最关注的RX VEGA64游戏卡。
RX VEGA64好事多磨,这卡从去年就开始传即将发布,直到今天总算是走完全部过程,使得AMD时隔两年之后再次推出高性能显卡,填补了RX 400/500系列显卡的市场空白。除此之外,RX VEGA64显卡还是首个面向消费级市场搭载HBM 2显存的显卡,就如上一次AMD在Fury显卡上首先商业化HBM显存一样,AMD在显卡技术上又一次做了先行者。
等了这么长时间,RX VEGA64显卡的最终表现如何呢?想必大家期待已久,今天我们的评测将为玩家揭开RX VEGA64系列显卡的神秘面纱,首先来看看AMD在VEGA64架构上都做了哪些改进吧。
1、VEGA架构:GCN架构大改
自HD 7970显卡首先应用GCN架构以来,AMD五年来的显卡一直在GCN基础上改进,到现在的RX 400/500系列显卡为止已经有四代GCN架构了,而VEGA显卡是GCN 5.0架构,而按照AMD官方说法,这也是GCN架构五年来最大的一次改进,引入了很多新技术,提高了架构效率及性能,改善了功耗。
从GCN架构问世以来,AMD在该架构的设计上就保持了相似的设计,其运算单元被称为Compute Unit,也就是我们常说的CU单元,每组CU单元包含64个SIMD单元,比如RX 480/580显卡是36组单元,总计2304个流处理器,上代旗舰Fury系列的Fiji核心是64组CU单元,总计4096个流处理器单元,而VEGA64也是64组CU单元,流处理器单元也是40-96个,总规模没提升,但VEGA64架构CU单元改进颇多,而且使用更先进的14nm LPP工艺制造,能效比Fiji的28nm工艺大幅提升。
具体的改架构进方面,比如现在的VEGA64 CU单元支持FP16半精度运算了,双倍于FP32单精度性能,在AI、机器学习等不需要太高精度的场合中性能可以翻倍提升。此外,VEGA64架构还大幅提升了L2缓存到4MB,几何、像素引擎也做了全新改进,具体就不一一列举了。
VEGA HBM2显存及HBCC缓存主控
除了GCN 5.0架构大改之外,VEGA显卡另一个引人注目的新技术就是HBM 2显存。大家可能还记得2年Fury X显卡发布时所用的HBM显存技术一样,这种新型显存不仅带宽远高于当时的高端卡,而且极大地节约了PCB面积,号称减少95%的PCB占用面积,使得AMD推出了不足20厘米的旗舰卡,后面更是有奇迹般的15厘米长R9 NANO显卡。
如果说上代Fury显卡还有什么不足,那就是4GB总容量有点捉襟见肘,不过在VEGA显卡上,AMD配备的容量达到了8GB,专业卡市场上则是16GB,容量上不再有遗憾。
VEGA显卡所用的HBM 2显存容量、频率、能耗皆有明显提升,其速率从HBM时代的1Gbps(数据频率)提升到了2Gbps,HBM单颗显存容量才1GB,HBM2堆栈容量则达到了前代的4-8倍,AMD使用的就是4GB版。
不过与上代HBM显存相比,AMD在VEGA上的堆栈方式有所改变,从之前的4颗堆栈减少到了2颗堆栈,等效位宽从4096bit降至2048bit,而目前的HBM 2显存频率还达不到预期的2Gbps,所以折抵下来VEGA显卡的带宽不升反降,从上代的512GB/s降至484GB/s。
对于这个问题,AMD早前表示带宽有所下降并不会影响VEGA显卡性能,从我们测试的经验来看确实如此,这点带宽确实不会对游戏性能有显著影响,但对AMD来说,减少一半的HBM 2显存则可以大幅降低成本及难度,毕竟目前的HBM 2产能还是不够多,制造工艺也相对复杂,这种新型显存在产能上是无法跟主流的GDDR5内存相比的。
除了HBM 2显存之外,AMD在VEGA架构上还设计了异构内存架构及HBCC(High Bandwidth Cache Controller)高带宽缓存主控,后者是一种革命性的显存架构,可以把显卡内存作为系统内存的最后一级缓存来使用,最高支持512TB虚拟寻址空间。
HBCC到底有什么用呢?除了用于专业市场帮助3D设计人员提高工作效率,它还可以用于游戏中,《杀出重围··:人类分裂》已经支持HBCC,AMD之前演示过HBCC的作用,游戏性能最高可以提升50%,最低帧也明显改善。
不过HBCC内存要想发挥优势,需要开发商做出针对性优化,目前支持的游戏还比较少,尚待AMD大力推动,而在驱动程序中HBCC默认也是关闭的,需要手动启用。
VEGA架构其他新技术:最完整的DX12支持
除了上述的新架构、新显存之外,VEGA显卡上还有其他新技术值得说说,第一个就是DX12支持,之前因为不能完整支持DX12.1而被NVIDIA的Pascal显卡奚落,不过VEGA64完美复仇了,AMD称之为目前最完整的DX12.1支持,即便是在每个可选的技术中,VEGA64也往往能支持到T3级别,领先于Pascal的T1-T2级别。
显示技术支持:最新HDR及FresSync 2
在显示技术上,VEGA64显卡相比目前的Polaris架构也有了更新,支持HDMI 2.0b、DP 1.4接口不说,分辨率可以上到8K 60Hz,并且支持最新的HDR。
值得一提的是,AMD今年初推出了FreeSync 2技术,在原技术基础上增加支持了HDR及LFC低帧率补偿,VEGA64显卡也不例外,它还在所有DP及HDMI接口上实现了HDCP 2.2及FreeSync支持。
与之对应的是,AMD在国内还会有捆绑促销,会赠送三星C32HG70QQC 31.5寸量子点显示器等产品的专属代金券。
●VEGA64显卡规格参数对比:HBM2显存带宽爆炸!
水冷版
风冷版
由于是相同的核心,所以水冷版和风冷版除了核心频率以外,其他参数都是相同的。
当然了,这最新版的GPU-Z现在还有一大堆VEGA参数都读不出来,要等下一版才行了。
RX VEGA 参数大对比 | ||||
显卡 | RX VEGA64 水冷版 | RX VEGA64 | RX VEGA56 | RX 480 |
架构 | Vega(GCN 5.0) | Vega(GCN 5.0) | Vega(GCN 5.0) | Polaris(GCN 4.0) |
核心型号 | Vega10 | Vega10 | Vega10 | Ellesmere XT |
晶体管数 | 125亿 | 125亿 | 125亿 | 57亿 |
制程工艺 | 14纳米 | 14纳米 | 14纳米 | 14纳米 |
流处理器 | 4096 | 4096 | 3584 | 2304 |
纹理单元 | 256 | 256 | 224 | 144 |
ROPs | 64 | 64 | 64 | 32 |
浮点运算 | 13.7TFLOPS | 12.66TFLOPS | 10.5TFLOPS | 5.8TFLOPS |
显存容量 | 8GB | 8GB | 8GB | 8GB |
显存类型 | HBM2 | HBM2 | HBM2 | GDDR5 |
显存位宽 | 2048bit | 2048bit | 2048bit | 256bit |
显存带宽 | 484GB/s | 484GB/s | 410GB/s | 224GB/s |
核心频率 | 1406-1677MHz | 1247-1546MHz | 1156-1471MHz | 970-1266MHz |
显存频率 | 1890MHz | 1890MHz | 1600MHz | 8000MHz |
TDP | 345W | 295W | 210W | 150W |
外接供电 | 8+8Pin | 8+8Pin | unknown | 8Pin |
参数点评:VEGA显卡除了VEGA64以外,还有一个VEGA56的型号,理论上是由相同的VEGA核心屏蔽而来,所以规格参数会稍微低一档。
VEGA64的流处理器数量极大地增加,到4096个,纹理单元则是256个,比GTX1080的160要多了。首次使用了HBM2显存,显存位宽为2048bit(HBM1是4096bit),但是HBM2的显存频率则提升为1890MHz(HBM1为1000MHz),显存带宽就是HBM2显存的强项了,高达484GB/s(GTX1080为320GB/s)。而浮点运算次数也是单芯A卡之最,高达13.7T,矿工有没有很兴奋?纸面数据非常给力,性能是值得期待的。
再来看看功耗,水冷版、风冷版功耗分别为345W、295W,一点都不低,需知道GTX1080Ti的功耗也才250W,所以如果性能不达到GTX1080Ti的话,那这就有点虚了。