凌燕 2018-10-16
大家都知道,8月20日,NVIDIA在科隆游戏展上发布了全新一代RTX 20系列显卡,全新的Turing”图灵“架构除了可观的性能提升之外,还带来了可以大幅度提升游戏画质的实时光线追踪技术(RTX)和大幅度优化高分辨率下游戏运行效率同时完成抗锯齿作业的“深度学习超采样”(DLSS)技术。而落实到实际产品,黄仁勋除了拿出新一代的旗舰RTX 2080Ti和次旗舰RTX 2080之外,还一起发布了全新的中端主力显卡RTX 2070。随着两款高端显卡的相继解禁和上市销售,RTX 2070也将在今晚迎来评测的解禁和首发销售。我们也提前拿到了来自映众的RTX 2070黑金至尊。RTX 2070是否能够不负众望,撑起未来至少一年里NVIDIA在中端显卡市场的一片天空呢?感兴趣的朋友千万不要错过了。
RTX 2070规格一览
RTX 2070使用12nm工艺制造的TU104-350 GPU核心,共2304个CUDA单元,约为RTX 2080Ti的53%。负责光线追踪的RT Cores 达到36个,负责DLSS计算的Tenser Cores达到 288个。显存方面使用了与RTX 2080相同的8GB GDDR6显存,等效频率达到14000MHZ,位宽256bit,耕升RTX 2070炫光的标准Boost频率达到1620MHz。TDP方面则只有175W。当然售价方面相比RTX 2080Ti和RTX 2080而言也要亲民许多。
核心架构解析
RTX 2070和两位“老大哥”一样也采用了全新一代的“图灵"架构,同样也支持了全新的RTX实时光线追踪和DLSS深度学习超采样技术。
RTX 2070所使用的TU106显示核心
完整的TU102核心
通过上面两张图可以看出来,RTX 2070所使用的TU106显示核心事实上是在完整TU102的基础上减半的结果,仅有36个SM单元,除显存位宽外几乎所有的规格都是TU102核心的一半。这与Pascal架构的GTX 1070所所使用的GP104为GP102一般的策略保持一致。
每一组SM单元中都配备了一个RT Core,以及两两成对的TENSOR Cores。可以看出,至少表面上来看上这一代FP32和INT32单元所占据的晶体管比例其实相对不那么高。从底层来看,这的确是近12年来GPU核心架构变化最大的一代产品。
把目光聚焦到Tensor Core本身,图灵架构的Tensor Core相对于Pascal上搭载的相同结构的最大变化就是将处理方式从2D平面升级到了3D,这意味着效率将以指数级增长。
GDDR6显存是基于前一代产品GDDR5X的继续优化产物,通过提升频率到7000MHz(等效14000MHz)将带宽提升到了14Gbps的水平,同时降低了40%的串扰。虽然性能仍然不能与HBM相比,但胜在成本低,良率高,可以持续大规模供货,不会出现显存供货影响显卡销售的隐患。
光线追踪与实时光线追踪
传统的光栅化渲染其实将一个3D图形的几何信息转变为一个个栅格组成的2D图像的过程,可以理解为在这个3D图形的每个点都包含有颜色、深度以及纹理数据,经过一系列计算变换后,将其转换为2D图像的像素,进而呈现在显示设备上。更多的是一种基于作者认为“这里应该有这个”的创作性质的图形渲染方式,一定以上来说就是已知结果并把结果写出来,而并不能知道这个结果是正确的还是错误的。