NVIDIA正式发布新一代「Turing」GPU微架构效能级绘图卡「GeForce RTX 2070」,採用全新12nm FFN制程的「TU106」绘图核心,内含108亿个电晶体、2,304个CUDA Cores,更新增 Tensor Core 及 RT Core 运算单元,带来革命性 AI 运算及光射追踪渲染,性能超越上代 GeForce GTX 1080,定价 US$ 499 美元、战力十足。
GeForce RTX 2070 登场
紧接上月上市的旗舰级「GeForce RTX 2080 Ti」与高阶级「GeForce RTX 2080」之后,NVIDIA再发布全新效能级的「GeForce RTX 2070」,同样基于全新 NVIDIA「Turing」GPU微架构,它是十多年来 GPU 最大的架构跃进,包括新增 Tensor 核心、RT 核心及许多新的进阶着色功能,透过全新硬体加速引擎及混合渲染技术,能实时提供光线追踪渲染,提供更逼真的物体阴影、反射及折射效果,除了性能表现进一步提升外,更将 PC 游戏真实感带进另一个层次。
与 NVIDIA「Turing」GPU 微架构开发并行,Microsoft 已在全新Windows 10 1809版本中加入了 A.I 人工智能及 DXR 光线追踪的 DirectML API,令游戏开发人员可以快速部署 A.I 人工智能技术与光线追踪于新游戏中,融合光栅化、实时光线追踪、人工智能和模拟,在 PC 游戏中实现令人难以置信的真实感,神奇网络提供惊人的新效果、电影级交互式体验和流畅创建或导航複杂 3D 模型的交互性。
此外,全新「Turing」GPU 还承继了「Volta」微架构中所有增强的「CUDA」功能,例如独立线程调度、针对多个 CUDA 应用的地址空间隔离 MPS 硬体加速能力以及全新的协作加速,令新一代 GeForce RTX 绘图卡的「CUDA」运算能力更灵活、性能更强大。
12nm FFN制程、TU106绘图核心
有别于以往 GTX 1070 与 GTX 1080 是基于相同核心,透过屏蔽运算单来划分市场区间,全新「GeForce RTX 2070」改用上「TU106」绘图核心,相较「TU104」绘图核心内建136亿个电晶体、Die Size约为 545mm²,全新「TU106」绘图核心缩减至108亿个电晶体、Die Size约为 445 mm²,有效降低了晶片生产成本。
架构方面,NVIDIA「TU106」绘图核心并非完全由「TU104」按比例作出缩减,内部单元的比例作出了相应的调整,完整的「TU106」绘图核心内含 3 个 GPC 图形处理群,18 个 TPC 纹理处理群集及 36 个 SM 串流多处理器,但删除了NVLink多绘图卡支援能力。
每个 GPC 内拥有一组独立的 Raster Engine 光栅处理引擎及 6 个 TPC 纹理处理群集,每个 TPC 群集包含 2 个 SM 模组,每个 SM 内建 64 个 CUDA Cores、8 个 Tensor Cores、1 个 RT Cores、256KB Register File 及 4 个 Texture Units,并拥有 96KB L1 Cache/Shared Memory 可因应运算或图形工作负载作出可改变的配置。
每个 SM 单元具备两个 FP64 运算单元,总数合共 96 个 FP64 运算单元,但图中并没有标示出来,它的作用是确保 FP64 代码的程式可以正常运作,但并非主要的硬体运算单元。
内建 8 个 32 bit GDDR6 记忆体控制器、总共 256bit 记忆体频宽,每个记忆体控制器绑定 8 个 ROP 单元及 512KB L2 Cache,合共拥有 64 个 ROP 单元及 4,096KB L2 Cache。
GeForce GTX 1070/1080 vs GeForce RTX 2070/2080
Peak FP16 Tensor TFLOPS
with FP16 Accumulate
Peak FP16 Tensor TFLOPS
with FP32 Accumulate
#. 所有 TFLOPS、TIPS 及 TOPS 速度基于GPU Boost Clock
*. Founders Edition 规格
^. 数字仅代表绘图卡 TDP,如使用 VirtualLink /USB Type-C 连接需额外增加 35W 功率