神之飞跃！RTX 40架构、技术、产品深度解析：价格大有玄机--快科技--科技改变未来

当前位置：首页 > 资讯中心 > 电脑办公 > 显卡 > 文章详情

正文内容 评论（0）

神之飞跃！RTX 40架构、技术、产品深度解析：价格大有玄机

2022-10-04 19:06:35 出处：快科技作者：上方文Q 编辑：上方文Q 评论(0)

#NVIDIA #显卡

盼星星盼月亮，NVIDIA GeForce RTX 40系列显卡终于来了。随着以太坊的转型、“矿潮”的退去，游戏玩家们终于有希望回归本源、体验新一代游戏生活。

RTX 40系列在架构、技术上有哪些革新？光追、DLSS 3真的有那么神奇吗？首发价格为什么定那么高？

今天，我们就来好好谈一谈。

【Ada架构初探：结构基本不变规模暴涨】

NVIDIA近些年的GPU架构代号，都来自历史上如雷贯耳的著名物理学家，比如Tesla特斯拉、Fermi费米、Kepler开普勒、Maxwell麦克斯韦、Volta伏特、Pascal帕斯卡、Turing图灵、Ampere安培……

GPU核心编号前缀一般都是字母“G”(代表Graphics)和代号首字母的组合，比如GT、GF、GK、GM、GP、GA。

当然，Turing系列有些特殊，因为GT已经用过了，所以改成了TU。

神之飞跃！RTX 40架构、技术、产品深度解析：价格大有玄机

RTX 40系列的架构代号、编号则都有些不同。

“Ada Lovelace”(以下简称Ada)，即阿达·洛夫莱斯，原名奥古斯塔·阿达·拜伦(Augusta Ada Byron)，著名英国诗人拜伦之女，数学家，计算机程序创始人，为计算程序拟定了“算法”，建立了循环和子程序的概念，写作的第一份“程序设计流程图”被珍视为“第一位给计算机写程序的人”，本人也被称为“程序员之母”。

为表纪念，美国国防部将耗费巨资、历时近20年研制成功的高级程序语言命名为Ada语言，被公认为是第四代计算机语言的主要代表。

GA的编号方式也刚刚用过，所以这一代都是AD系列。

Ada AD10x系列核心采用NVIDIA单独定制的TSMC 4N工艺制造，其中旗舰核心AD102集成最多763亿个晶体管。

这是三星8nm工艺GA102 283亿个的足足2.7倍，但核心面积反而从628平方毫米缩小到608平方毫米，晶体管密度高达1.255亿个/平方毫米，提升了超过1.7倍。

仅仅四年前的Turing RTX 20，台积电12nm工艺，也才186亿个晶体管，每平方毫米还不到2500万个，实在令人感慨技术进步之快。这部分会在后边详谈。

新的Ada架构全面升级了SM流式多处理器、RT光追核心、Tensor张量核心、视频编解码引擎，还带来了真正强大实用的光流处理器(OFA)，但这一次彻底去掉了NVLink总线模块，永别了SLI。

AD102核心共有18432个CUDA核心(分为12组GPC/72组TPC/144组SM)、576个第四代Tensor Core张量核心、144个第三代RT Core光追核心、576个纹理单元、192个ROP单元、18MB一级缓存、96MB二级缓存、36MB寄存器文件。

其中，一级缓存增大了71％，二级缓存不但是Ampere架构的多达16倍，而且经过彻底重构，对于任何应用都能带来明显提升，尤其是光追中的路径追踪等复杂操作会获益匪浅。

或许，这就是NVIDIA敢于把产品显存位宽使劲往下砍的原因，大容量、高带宽的二级缓存可以有效弥补带宽，就像AMD Infinity Cache无限缓存，只是后者需要大容量才能提现优势，Ada这边做到96MB也不算太大，显然带宽高得多(暂无具体数据)。

值得一提的是，AD102核心有288个FP64双精度浮点核心(每组SM 2个)，浮点性能是FP32的1/64，专门用于处理FP64代码，包括FP64张量核心代码。

GPC依然是NVIDIA GPU的顶层组成单元，所有的关键图形单元都在这里，结构组成上整体而言Ampere架构没啥不同。

每个GPC包括一个独立光栅引擎、两个ROP分区(每个包含8个ROP单元)、六组TPC，而每个TPC又包括一个多边形引擎、两组SM。

SM单元的内部组成也和Ampere如出一辙，可以分为四个部分(分区)，以及128KB一级数据缓存/共享内存、一个第三代RT光追核心。

每个分区内又有64KB寄存器文件、零级指令缓存、一个Warp调度器、一个分配单元、16个FP32单精度浮点CUDA核心、16个FP32/INT32单精度浮点和整数混合CUDA核心、一个第四代Tensor张量核心、四个载入存储单元、一个特殊功能单元(SFU)用于执行图形差值指令。

RTX 40系列采用了与台积电定制优化的4N工艺，得以集成比GA102核心多70％的CUDA核心，成就了史上最复杂的GPU芯片，还大大提升了运行频率，RTX 4090可以加速到2.52GHz，是N卡史上最高的。

与此同时，能效也大大提升，RTX 4090功耗和RTX 3090 Ti完全持平，能效因此达到了其2倍之多。

责任编辑：上方文Q

内容导航

相关资讯

支持打赏
支持0人
反对
打赏

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#NVIDIA #显卡 #RTX 4090 #RTX 4080 16GB #RTX 4080 12GB #Ada Lovelace

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

关于我们
关于我们
隐私权说明

交流合作
加入我们
意见反馈
广告刊例

关注我们
微信公众号：
微博号：快科技官方
QQ群：53467377

安卓客户端下载
IOS客户端下载

APP下载

手机扫码下载

支持Android/iOS/iPad
投稿
纠错

线索爆料

爆料群

爆料1群

打开微信扫一扫
扫描入群，加入爆料
意见反馈
评论
返回顶部