"天河二号”超级计算机年耗电费至少1亿

2014-07-04 13:20


IT领域的摩尔定律认为,电脑性能每18个月就将提升一倍。中国“天河二号”超级电脑在世界超级电脑排行榜上连续三次夺得冠军,固然值得庆贺,但另一方面也显示,超级电脑的技术陷入瓶颈状态。据香港《成报》网站7月3日报道,中国计算机学会高专委秘书长、中科院计算所研究员张云泉表示,以往超级电脑通过增加处理器数量就能不断提高性能。

https://img.linux.net.cn/data/attachment/album/201407/04/132008mucu23gxo3kugoun.jpg

“天河二号”超级计算机

但美国劳伦斯·伯克利国家实验室的豪斯·费姆尼教授认为,最近几年超算技术上的发展,都不足以突破艾级超算的障碍。原来认为2018年就能实现1000P级别的超算,现在推迟到2020年,甚至2022年都无法实现。

大功率处理器散热难

超算发展目前面临的挑战首先是功耗控制难。目前的集成水平和此前相比并没有根本性改善,以现有技术,极超级电脑的功耗会超过20兆瓦,建造费用将超过2亿美元,这将带来一系列技术和运营问题。例如“天河二号”一年仅电费就要1亿元人民币,全速运算的话,电费更高达1.5个亿。如果还是按照老思路,依靠增加规模制造出的极级超算,功耗可能会达到50兆瓦-100兆瓦,这需要有一个专门的核电站来给它供电,这样的超算显然没有实用价值。同时这样密集排列的大功率处理器,也会带来无法解决的散热问题。因此国际上公认的极级超算标准是,功耗必须控制在20兆瓦内,这就要求在制造工艺上有革命性突破。

其次是可靠性问题,将来超级电脑併发部件将超过10亿,以现在的故障率,平均每过10至20分钟系统就会报一次硬件错误,而每次处理错误需要半个小时。这显然也是无法容忍的。

报道称,超算还面临数据的访问速度限制。现在超级电脑运行的速度愈来愈快,但现有存储器读取数据的速度却已无法跟上需求,也成为超级电脑性能提升的瓶颈。因此美国也有一批教授认为应该反思超算的发展方向,改变追求峰值运算速度的模式,而注重实用价值。例如放弃通用型超算,而是根据实际需求定制超算。

报道认为,超算要取得更长远发展需要解决架构难题。高效能服务器和存储技术国家重点实验室主任、浪潮集团首席科学家王恩东认为,如何开发更加创新的系统架构从而突破性能瓶颈,使超算性能从千万亿次上升到百亿亿次,这是全球超级电脑专家都关心的话题之一。去年在上海交通大学上线运行的中国高校第一超级电脑就使用了浪潮和上海交大共同开发的CPU+GPU+MIC的创新技术架构,目前这种架构被普遍认为是突破P级到极级最有可能的方法。

超算突飞猛进美不安

中国目前在全国各地已投资建设或计划建设八个国家超级计算机中心,其中包括将在无锡新建的一个大型超级计算机中心。中国在超算领域的快速突破,让美国感到不安。4月底,美国政府在加州大学圣地亚哥分校的全球冲突与合作研究所邀请中美超级电脑专家召开“中美超级计算战略对话会”,目的就是研判中国现在发展超算的目的是甚么,是用于军事还是科学研究?美国一直担心,如果中国在超算核心硬件上实现了自主可控,应用软件也上去了,以后美国就无法在超算领域限制中国的进步了,从而威胁美国的领先地位。据张云泉了解,事实上现已有欧美科学家因为无法在本国找到合适的超算平台,而前往中国超算中心来运行科研程序。