AMD 正式发布「Radeon RX 6800 / RX 6800 XT」显示卡登场,採用全新「RDNA 2」GPU 微架构在相同功耗下性能大幅提升 + 54%,创新 Infinity Cache 技术配合 16GB 大容量 GDDR6 记忆体、追加 Ray Accelerators 光线追蹤引擎,配搭自家 Ryzen 5000 处理器更可提供 Smart Access Memory 加速,究竟新卡能否为 NVIDIA 带来威胁,HKEPC 编辑部找来 AMD Radeon RX 6800 / RX 6800 XT 与 GeForce RTX 3080 作对比测试。
268 亿个电晶体、AMD Big Navi 正式登场
代号 Big Navi、全新 RDNA 2 GPU 微架构, AMD 全新 Radeon RX 6800 系统正式登场,採用全新「Navi 21」绘图核心在性能表现或功能规格均有着惊人突破,是 AMD 近年来首次追接 NVIDIA 高阶型号。
定位方面,AMD 将会在 11 月 18 日推出 Radeon RX 6800 与 RX 6800 XT 两款型号号,RX 6800 拥有 60 个 CU、3,840 个 Stream Processors、16GB GDDR6 容量,官方定价为 US$579美元;RX 6800 XT 则拥有 72 个 CU、4,608 个 Stream Processors、16GB GDDR6,官方定价为 US$649 美元,假想敌是GeForce RTX 3080。
此外,AMD 会在 12 月 8 日再推出旗舰级的 Radeon RX 6900 XT,拥有完整 80 个 CU、5,120 个 Stream Processors、16GB GDDR6 容量,官方定价为 US$999 美元,但不会有非公板型号,对手将会是 GeForce RTX 3090。
经改良的 RDNA 2 GPU 微架构
外间称它为 N 卡杀手,全新的「RDNA 2」微架构是基于「RNDA」作出改良,目标是在相同的内部频宽框架下,将 CU 单元的数目提升 100%,透过微架构的最佳化实现同时脉下 CU 单元功耗降低 50%,或是相同功耗让时脉提升 1.3X,另一个方向是能大幅提升内部缓存命中,让 CU 单元减低单元闲置,令 GPU 指令吞吐量能进一步提升,在 GDDR6 频宽保持不变提升记忆体有效频宽等,最终达至 +54% 的性能功耗比提升。
全新「RDNA 2」设计针对 Compute Unit 重新设计,「Navi 21」绘图核心增至 4 个 Shader 引擎共享前端,每个 Shader 引擎拥有 2 组 Graphics Array 运算群,每个 GA 运算群内含 5 个 Dual Compute Unit (DCU) 并共享 L1 Cache、Rasterizer、RB+、Prim Unit 等资源,总计整颗晶片合共有 80 个 CU 单元、数目增加了 1 倍 100%。
此外,前端换上了重新设计的 RB+ 光栅化单元,每个 Shader 引擎共享 32 个 RB+ 单元,数目与上代 RDNA 相同,但每个週期能处理 8 个 32bit Pixel 指令,数目是上代的 1 倍,更重要是新增Variable Rate Shading (VRS) 可变速率着色、 Mesh Shaders 网格着色器、Sampler Feedback 取样器回馈等功能,以满足 DirectX 12 Ultimate 规格要求 ,允许游戏选择性地降低画面里部分区域的细节水平来提高效能,对图像品质几乎没有明显影响但性能却能进一步提升。
RDNA 2 微架构与 RDNA 同样採用 Dual Compute Unit (DCU) 设计,将 2 个 CU 结合在一起并共用 Scalar Data Cache、Sahder Instruction Cache 及 Local Data Share,DCU 设计可以让 Shader Processor 之间有更佳的并行运算能力,今代积累 Zen CPU 研发时所得出的高时脉设计经验,RDNA 2 加入了 Streamlined Micro-Architecture 设计,DCU 的 Pipeline Logic 布局修改后,令运作时脉可以在相同功耗下提升 1.3X。
RDNA 2 微架构在每个 CU 中加入了 Ray Accelerator (RA) 硬体加速运算单元,属于软硬体混合加速方式,实现支援光线追踪影像特效,它是基于 Microsoft Raytracing (DXR) API,每个 Ray Accelerator 每个时钟可完成 4 Ray/Box 或 1 Ray/Triangle 的光线相交运算,运算速度较纯软件运算性能提升约 10x,虽然与 NVIDIA 的 RT 硬体运算单元设计仍有距离,但至少 Ray Tracing 不再是 NVIDIA 卡的专利。
AMD 全新的 Inifinity Cache 技术
有别于 NVIDIA 採用更宽的记忆体介面、更高速的 GDDR6X 记忆体颗粒,AMD 的做法明显比 NVIDIA 聪明,在 RDNA 2 微架构中首次加入 Infinity Cache 技术在 L2 Cache 与 GDDR6 之间加入了 128MB 缓存,GPU 与 Infinity Cache 之间由 16 条 64bit 1.94GHz 的 Infinity Fabric 连结,频宽基本上是 256bit GDDR6 记忆体的 4 倍。
据 AMD 指出,Infinity Cache 将能大幅升游戏 Workload 资料命中率,降低读取延迟达 34%,并减少 GDDR6 记忆体频宽使用,实际性能表现近乎是 384bit GDDR6 的 2.17x,但却用只需 384bit GDDR6 的0.9x 功耗, Infinity Cache 可以说是 RDNA 2 微架构最重要性能改动。
搭配 Ryzen 5000 支援 Smart Access 技术
除了 Infinity Cache 技术外,RDNA 2 微架构另一项重要的记忆体改良就是 Smart Access Memory 技术,传统的 x86 PC 架构中受限于 PCIe 规範,只能透过 Base Address Register (BAR) 每次将 256MB 系统记忆体射映到 GPU 记忆体,这个限制严重影响到系统记忆体与 GPU 记忆体之间的资料传输效率。
AMD 在 RDNA 2 中加入了全新 Smart Access Memory 技术,当用家使用AMD 新一代 Ryzen 5000 系列处理器时,不再使用 PCIe Mapping 方式,CPU 可以直接存取 GPU 记忆体,完全解除 CPU 与 GPU 之间的读写瓶颈,游戏性能平均能提升约 6%,尤其对大量使用 Texture 贴图的游戏,效能提升会更为明显。
AMD Radeon RX 6800 Family Specifications