正文内容 评论(0)
四、应用生态优化:35倍性能提升你信吗?
刚才说的各种夸张性能,除了各种基准跑分炫技,更关键的是在实际商用场景中落地。
当然了,对于如此强劲的产品,没有谁可以拒绝,线程撕裂者已经累计拿到了1000多个客户设计,还在快速增长。
客户名单中,也可以看到一些如雷贯耳的大名:阿斯顿马丁、梦工厂、EA、Epic Games、福克斯体育、高盛、工业光魔等等。
在专业领域,要想真正释放硬件的性能潜力,软件的优化、认证是至关重要的。
AMD在这方面也是花费了大量的心思,面对上百款专业级的媒体与娱乐、设计与制造、科学与研究软件,都在大力推进优化与认证,当然还有很多很多的工作要做,提升的空间非常大。
AMD指出,对于线程撕裂者PRO 7000WX系列,应用优化有四大难点,也就是如何高效利用所有核心、Zen 4核心架构与指令集、SoC架构、AVX-512指令。
经过长时间的准备与深入的行业合作,AMD在这几个方面都取得了不俗的成果。接下来就举几个例子。
96个核心192个线程看起来固然威猛,如何高效利用是个难题,关键就是把工作负载并行分布在尽可能多的核心和线程上,也就是采用高度并行化的算法。
比如CAD中常见的3D物体轮廓线绘制,处理500万表面、700万边缘的模型,算法未经优化只能用到16个线程,而在优化后可以用满192线程,效率提升最多达惊人的35倍。
针对Zen架构的设计,AOCC、CLANG/LLVM、VC++编译器,AOCL库、AVX指令经过优化后,都可以获得立竿见影的效果。
其中,AOCL库就有多达12个不同的行业标准数学库优化,可以大大提高科学与高性能计算应用性能。
举例来说,Ansys HFSS电磁模拟性能优化后可提升最多51%,Ansys Mechanical机械分析性能优化后可提升最多达2.8倍。
针对线程撕裂者的SoC架构,包括Chiplet布局、三级缓存体系、内存控制器通道等等,只要适当优化,同样可以获得性能的显著提升。
在这方面,Solidworks Plastics塑料仿真软件、Ansys Fluent计算流体动力学软件、Ansys CFX流体仿真软件都是比较典型的代表,可以额外释放8-13%不等的性能。