正文内容 评论(0)
黄仁勋在会上表示,除了传统的科研、军事等用途外,HPC超级计算机/高性能计算如今已经应用在各种领域,比如生物医药、地质勘探、汽车设计、医疗成像、金融、产品设计、天气预报等等。
以NVIDIA这样的芯片设计公司为例,30年前进行微电子产品设计需要大量组装实物元器件进行测试。而今,NVIDIA所有的GPU设计都是在高性能计算机上通过模拟实验完成的。
大家应当已经猜到了,照片中在实验室里设计电路的小伙子,正是1982年在俄勒冈州立大学就读大四的19岁黄仁勋。
NVIDIA每年要为自己公司使用的超级计算机硬件升级、维护花费超过1亿美元。目前该机拥有超过40000个CPU核心,其计算性能绝大部分都被用在了Verilog电路设计模拟上。
在多样化的应用背景下,NVIDIA认为高性能计算将从传统的完全依靠x86服务器,演变为以应用需求为区分的三种方向,其中企业服务器仍然会以x86架构为主,需要大量处理简单计算需求的网页服务器则会应用高能效的ARM架构产品,而主打大规模并行计算的超级计算机则会走向GPU。
这一点,从全球超级计算机运算能力的发展趋势就可看出端倪。过去的约10年中,TOP500全球最高速超级计算机的总运算性能提升速度基本上和摩尔定律保持一致。而在2007年左右,TOP500超级计算机的性能开始明显的加速上涨。这一时间点,正是GPU被引入超级计算机的开端。
之前的多年中,我们只有在政府支持的超级计算中心或科研机构中,才有机会看到超级计算机的身影。而现在随着GPU加速应用带来的超级计算机成本下降,更多的企业也开始有机会使用HPC,将高性能计算真正使用在产业应用中。
这里黄仁勋举了一个相当有趣的例子,产品线包罗万有的宝洁公司将高性能计算应用在了各种产品的设计研发当中。比如用HPC设计品客薯片的弧度,使其完美的“飞行”在生产线当中。其他诸如咖啡杯、洗发水等产品的设计也都在大量应用超级计算机。
在这一超级计算革命中,科学家们如今找到的最佳方案是使用CPU结合GPU。由CPU来完成顺序运算工作,而使用集成大量核心的CUDA GPU完成并行计算。
这种“异构计算”应用的典型例子就是中国的天河一号A,它使用了超过14000颗CPU,辅以7168颗Tesla M2050 GPU,总运算能力2.5PFLOPS,成为当今全球最强的超级计算机。天河一号主任设计师,国防科大计算机学院系统软件研究室主任杨灿群今天也到场介绍了该机的设计过程。据称,从去年的试验性系统,到今年的天河一号A,他们将GPU加速的效率从20%提升到了70%,同时使用自主开发的节点网络系统,规模和性能是去年使用的进口成套网络系统的两倍。
目前在TOP500全球超级计算机排行榜中,排名第一的天河1A,第三的星云和第四的日本Tsubame都使用了Tesla GPU。
而如果考虑这些超级计算机的功耗,则GPU加速系统的优势更加明显。
在绿色超级计算机排行榜中,前十名有7台为Tesla加速机型,余下三台为IBM蓝色基因系统,TOP500排名第二的Jaguar能效则只能排在第81位。
而相比蓝色基因等专用超级计算机系统,CUDA GPU计算还有一项明显的优势,即随处都可以找到CUDA系统进行编程开发。在超级计算机领域,提供CUDA GPU加速商用化产品的厂商数量已经从2009年的趋近于0,猛增到今年的接近全部。
最后,自然还是要展望一下未来。正如九月底GTC上公布的计划那样,NVIDIA将在明年发布Kepler,2013年是Maxwell,后者在功耗保持不变甚至更低的情况下,性能将是2007年Tesla的16倍。
再往后还有2018年的Echelon计划,将使用在百亿亿次计算机当中,同等功耗性能是Fermi架构的100倍。