正文内容 评论(0)
一、前言:RTX 3080的到来 和说好的完全不一样
3D图形卡领域的第一次革命是1999年NVIDIA公司推出的GeForce 256,它集成了T&L技术(硬件光影转换),将光影处理从CPU中接手过来,解放了CPU的同时也极大的提高了游戏的性能以及画面的真实性。
T&L技术之后3D图形技术的另一次飞跃则是2006年的基于统一渲染构架的DX10。它将此前的Vertex Shader(顶点着色器)和Pixel Shader(像素着色器)统一为streaming processor(流处理器),自此之后设计的GPU都不会再开辟独立的管线,而是所有的流处理器运算单元都可以任意处理任何一种Shader运算,使得GPU的运算效率得到了成倍的提升。
尔后10年,GPU领域没有突破性的技术出现,DX12属于雷声大雨点小,对性能的提升并没有想象中的那么美好,Physx则是曲高和寡。
直到2018年8月,实时光线追踪技术的出现,将3D游戏的画面推向了一个新的高度,玩家第一次在游戏中见到了如同科幻电影般的光影世界。
图灵GPU发布之后,NVIDIA的市值一路飙升,甚至超越了Intel。财大气粗的老黄没有让我们等太久,仅仅二年的时间,NVIDIA再一次革新了GPU构架。
2020年9月4日发布的基于新一代Ampere安培架构的GeForce RTX 30系列显卡统一了INT32与FP32单元,原本只能做整数运算的INT32单元现在既能做整数运算,也能做单精度浮点运算。
这一项技术革新将传统意义上的流处理器数量直接翻倍,同时GPU的浮点运算能力也提升了一倍。于是我们就看到了RTX 3080的流处理器数量直接从RTX 2080的2954个暴增到了8704个,恍然间仿佛又回到了8800GTX时代。
完整的GA102共有7组GPC,每组GPC有12组SM单元外加16组ROP单元,总计是84组SM单元与112个ROP单元。
RTX 30系列显卡视乎规格不同启用的SM单元总数不同,RTX 3090是7组TPC、24组SM单元与112个ROP单元,RTX 3080是6组TPC、68组SM单元与96个ROP,RTX 3070是6组TPC、46组以及96个ROP。
这是GA102核心的SM单元构架,每个SM单元有64个INT32整数核心、64个FP32单精度浮点核心、2个FP64单元(未标示出来)、4个第三代TENSOR COREs以及以及1个第二代RT CORE。
这里的INT32单元可以根据需求进行单精度整数或者浮点运算,也就是说理论上一个SM单元可以拥有高达128个FP32单元。
融合了一级缓存与共享缓存,每SM单元中缓存总容量为128KB,可以按需灵活分配给一级缓存与共享缓存(Shared Memory),可以是64KB+64KB的组合,也可以是32KB+96KB的组合。
此次NVIDIA一共发布了3款GA10X核心的显卡型号。
RTX 3090:拥有7组GPC,82组SM单元共计10496个流处理器、112个ROP、328个纹理单元、328个第三代Tensor Cores、82个第二代RT Cores。搭配24GB GDDR6X显存,显存频率19.5GHz、
位宽384Bit,带宽936GB/s。相比于Titan RTX快了50%,9月24日上市,售价11999元。
RTX 3080:拥有6组GPC,68组SM单元共计8704个流处理器、96个ROP、272个纹理单元、272个第三代Tensor Cores、68个第二代RT Cores。搭配10GB GDDR6X显存,显存频率19GHz、
位宽320Bit,带宽760GB/s。综合性能是RTX 2080的二倍,9月17日上市,售价5499元。
RTX 3070:GA104核心,拥有6组GPC,46组SM单元共计5888个流处理器、96个ROP、184个纹理单元、184个第三代Tensor Cores、46个第二代RT Cores。搭配8GB GDDR6显存,显存频率14GHz、位宽256Bit,带宽448GB/s。综合性能与RTX 2080 Ti但价格只有一半,10月份上市,售价3899元。
RTX 3080的详细规格如下: