正文内容 评论(0)
作为对ARM Mali-T800系列的直接回应,Imagination今天正式发布了新一代移动GPU PowerVR Series7系列,包括高端7XT、低端7XE两个子系列。
下边,我们就细细看看它的底层架构设计,并预览一下性能。
【PowerVR 7架构解析】
本质上来说,PowerVR 7的架构还是“Rogue”,已经引入两年。该架构有着先进的着色器流水线体系,没什么明显缺点,短期内还无需彻底翻新,只要局部增强、完善就可以提升效率和性能了,包括强化指令集。
当然,它还需要不断加入新的功能特性,尤其是新的API。OpenGL ES 3.1早就支持了,但是苹果的Metal来势汹汹,作为回击的Google Android Extension Pack现在是不能少的,还加入了可选项Direct3D 11.1(通俗地说就是DX11.1)。
但是注意7XT上这两个都是标配,7XE上的AEP只是可选项,Direct3D则只到10.0。
这次唯一增加的新模块就是“曲面细分协处理器”(Tessellation Co-Processor),可配合顶点数据管理器(Vertex Data Master)实现完整的曲面细分支持,但注意为了节省功耗,它是个固定功能单元,不可编程。
曲面细分、ATSC纹理压缩、几何着色、纹理着色,这些就是支持AEP的基础。
其他模块没有大变但都有所增强,比如说顶点数据管理器(几何前端)的几何性能翻了一番,计算数据管理器(Compute Data Master)则提速了最多三倍,尤其适合处理大量的小内核。
粗纹理调度器(Coarse Grain Scheduler)降低了内部区块关联性,可以更快地向空闲核心(着色器簇/USC)发送指令,而不必等待其他核心完成工作。
USC核心本身变动很小,FP16/FP32 ALU、浮点单元都没变,但是特殊功能单元(SFU)有了两处明显变化。首先也是最重要的,SFU可以原生处理FP16、FP32操作了(上代会全部推给FP32),因此在处理FP16数据集的时候不必进行无谓的高精度操作,自然能节省功耗,而且因为SFU本身已经很大了,原生FP16带来的功耗节约会很明显。
另外虽未明说,但极有可能FP16、FP32 SFU单元已经分离成了独立的两个(架构图显示一个),当然即便如此它们也不能同时使用。
第二个增强是SFU操作可以和ALU操作并发了,也就意味着两个单元可以同时工作。Imagination表示,SFU代码比预期得来得更快,因此并发会大大提高性能,为此指令集也做了相应的扩展。
此外,PowerVR 7系列还可选支持FP64操作,按照设计每核心有一个FP64 ALU。
最后是个非图形功能,硬件加密区,使用虚拟化技术创建最多8个区域,彼此完全隔离,可进行不同的安全操作,并与CPU、GPU互联。7XT会标配它,7XE上则是可选。
CPU上早就有了类似的功能,GPU上则一直是软件模拟,效率低下,而且安全性不足。
【7XT/7XE:高低双雄细节探究】
7XT是高端型号,但也有很多技术特性是可选的。FP64操作、OpenCL 1.2 Full Profile是面向高性能计算用途的(默认仅支持FP32、OpenCL 1.2 Embedded Profile),Direct3D 11则适合Windows Phone、Windows RT平台设备(默认是Direct3D 10),但是曲面细分已经是标配。
通过灵活配置这些特性,SoC厂商可以精确满足自己和客户的需要,同时更好地控制面积和功耗。
其实相比于性能,能效才是7XT系列提升的重点。Imagination没有给出任何具体数据(提升了百分之多少),只是说7XT可以更低的功耗提供与6XT持平的性能,同时给了一张幻灯片,号称自己有着全球最高的GPU能效。
证据就是自己的PowerVR长时间运行也几乎不会降频,竞争对手的则会降低40-60%。
当然了,这能否实现还得看SoC厂商的设计,Imagination只能提供最基本的建议。人家非要把CPU、GPU频率弄得很高,跑着跑着就会过热降频,你也没辙。
7XT系列的核心可选2-16个,比上代最多翻了一番,具体型号分别是:双核心GT7200、四核心GT7400、六核心GT7600、八核心GT7800、十六核心GT7900。
很有意思的命名吧?Imagination甚至说GT7900的性能已经可以超越入门级笔记本独显GeForce GT730M。GT7400/GT7600则是上代主机Xbox 360、PS3的水平。
用途方面,2-4个核心的适合手机,6-8个可用于平板机、汽车、超极本,16个的只有笔记本、机顶盒、游戏机、服务器才敢用——512个FP32 ALU单元差不多可以媲美入门级桌面独立显卡了。
目前的6XT系列里,iPhone 6用到的GX6450是四个核心,iPad Air 2里的GX6650旗舰型号六个核心。
7XE定位于入门级,规格、成本都很低,并且更强调面积上的效率,而不是功耗。
7XE其实也有着7XT相同的架构改进,可以支持7XT的几乎所有技术,但绝大部分都是可选项,包括DirectX 11、曲面细分(AEP自然也是可选了)、纹理压缩、HEVC/H.265解码、10-bit YUV色彩输出、虚拟化安全。OpenCL 1.2 FP都直接不可选。
7XE有两个版本,一个核心的GE7800面向低端手机和电视,半个核心的GE7400则面向最便宜、最简单的设备,以及可穿戴设备。
Imagination声称,7XE的功耗满载也不会超过1W,待机时几乎可以忽略不计。
【性能咋样?】
真正使用PowerVR 7系列的处理器、设备要明年底才会出现,而我们都知道,ARM、Imagination他们都只是卖CPU、GPU授权,具体什么样子还得看SoC芯片厂商的选择,包括核心数量、技术特性、制造工艺、运行频率等等,因此现在是无法说清性能的,只能有一个大概的预估。
Imagination宣称,在同样核心数量、同等频率下,7XT系列的性能可比6XT系列提升35-60%,如果真能实现是很猛的,但这也意味着功耗会增加很多,因此最终在考虑功耗的前提下,性能提升绝对不会这么高,而且这只是理论测试,实际应用中又会打个折扣。
而在能效方面站出来的是7XE,官方号称相比6XE提升幅度少则40%,多则可以超过100%。
结语:
PowerVR 7系列可以配置出各种不同的版本,最高最低相差32倍,因此理论上适合各种各样的设备,从智能手表、手环到笔记本甚至是服务器计算集群。
PowerVR 6系列是CES 2014大展上宣布的,最近才刚刚投入实用,iPhone 6/Plus、iPad Air 2就是典型代表。PowerVR 7系列的零售产品预计会在一年后面世,正好就是下一代iPhone、iPad发布的窗口,而按照苹果与PowerVR的一贯良好合作关系,iPhone 7(6S)几乎必然会用PowerVR 7,而且说不定会有6个核心。
ARM Mali-T800、高通Adreno 400、NVIDIA麦克斯韦……明年的移动GPU,注定会精彩异常。