正文内容 评论(0)
2010年底,我们曾经亲身走进天津的国家超级计算中心,目睹了当时世界第一超算天河一号A的风采。世事变迁,性能堪比至少五个天河一号A的“泰坦”(Titan)又在美国的橡树岭国家实验室(ORNL)里屹立起来。接下来,我们就跟随国外记者的脚步,一同去探秘这个新的全球超算No.1。(友情提醒:图灰常灰常多哟……)
【从美洲虎到泰坦】
ORNL是美国能源部委托UT-Battelle公司管理的一个国家级核心科技研究基地,超级计算机只是他们的一个工具而已。上一代的“美洲虎”(Jaguar)建成于2005年,之后每年都在进行升级,泰坦则是一次超大规模的更新换代。
泰坦还是200个定制的19英寸机柜和18688个计算节点,但已经更换为最新的Cray XK7计算系统,内部配置也大为不同:登陆与IO节点翻番为512个;处理器还是AMD Opteron,但是从12核心变为16核心,总的核心数量从224256个增加到299008个;每颗处理器搭配开普勒架构的NVIDIA Tesla K20高性能计算卡,总计18688个GPU;系统内存每个节点原来是16GB,现在不但翻番为32GB,还有6GB GDDR5显存,总量从300TB增至710TB;硬盘是一万块标准的1TB 7200转2.5寸机械盘,总容量10PB,下次升级会增加到20-30PB。升级替换下来的老硬件照例都交还给Cray。
单单是CPU、GPU加在一起,整套系统就有177万亿个晶体管!
由于超算的大部分工作都是远程执行的,泰坦内部还有几十个10Gbps以太网链接,还接入了能源部能源科学网络(ESNET)的100Gbps骨干网内。
而在峰值浮点性能方面,美洲虎“只有”2.3PFlops,泰坦猛增了几乎十倍,超过20PFlops,也就是每秒钟可进行2亿亿次计算。
全速运行的时候,它需要消耗900万瓦特电力,典型负载下也要700万瓦特,而这也是唯一限制它扩充的地方。为了减少供电线厚度,电压是很高的480V而不是当地标准的208V。
泰坦的升级工作已经按时基本完成,并且立即就能投入科学计算工作,而且得益于Tesla计算卡的加盟,大量科学应用可以提速4-8倍。
至于泰坦是不是能够成功拿下第一,要到半个月后的新一届超算大会SC12上才会知晓,但就目前看来,已经是十拿九稳的了。
【走进橡树岭国家实验室】
【泰坦超级计算机内部探秘】
接下来就是泰坦本身了。看照片为主,必须要的时候我们会注释一下。
每块板子上安装四颗十六核心Opteron处理器和四块Tesla K20计算卡
整个超级计算机就是由一个个这样的Cray XK7计算板组成的
NVIDIA的Jonah Alben正在拍照——这可是GK110核心的设计师之一
【泰坦的组装:跟DIY装机差不多】
也许你想知道如此一套规模宏大的超级计算机系统是怎么组装的,但说出来可能会让你觉得很没意思,跟普通人DIY装机并没什么两样,只不过设备略有不同,同样的工作需要重复N多次而已。