纽约市Flatiron Institute运营的一台新超级计算机在最新的 Green500 全球最节能超级计算机榜单中名列前茅。
修订后的列表根据每瓦功率每秒浮点运算(或“触发器”)的数量对超级计算机进行排名,新超级计算机的时钟频率为每瓦 650.91 亿次触发器。这打破了之前的记录保持者,后者每瓦可产生 626.84 亿次触发器。新的 Flatiron Institute 超级计算机以 203.8 万次失败次数位居世界第 405 位最强大的计算机。
“这台超级计算机为开展新型科学开辟了机会,”熨斗研究所科学计算核心联合主任伊恩菲斯克说。 “这是一台主力机器,我们将让我们的研究人员尝试新事物并推动发现。”
Flatiron Institute 的研究人员将利用新型超级计算机的强大功能来解决计算天体物理学、生物学、数学、神经科学和量子物理学中的棘手问题。该系统使用 NVIDIA 加速计算平台,该平台非常适合机器学习应用,例如宇宙演化的多体模拟、预测蛋白质如何折叠和发挥作用,以及寻找基因组研究中的相关性。加速计算平台还擅长模拟电子在量子尺度上的行为的线性代数计算。这是因为此类平台使用图形处理单元 (GPU) 来并行运行比传统中央处理单元 (CPU) 多得多的计算。
该系统位于新泽西州的一个数据中心,由联想构建,利用了该公司 ThinkSystem SR670 V2 的效率功能,该服务器旨在轻松安装到传统数据中心,并可供更多研究人员访问。即使在高热、多 GPU 环境中,其高效设计也能有效保持凉爽。在其运行配置中,该机器拥有 20 个与 NVIDIA Quantum InfiniBand 网络平台相连的节点,每个节点包含四个 NVIDIA H100 Tensor Core GPU。 (在效率基准测试中,机器使用了 10 个节点,每个节点有 8 个 GPU。)
NVIDIA 芯片组上的晶体管宽度仅为 4 纳米,这意味着可以在相同尺寸的芯片上集成更多的计算能力。更小的晶体管尺寸和许多其他优化有助于降低新型超级计算机的能耗并最大限度地提高其性能效率。
在不牺牲性能的情况下降低超级计算机的功耗有很多好处。电力是机器运行成本和环境影响的重要组成部分。消耗的每一瓦特都会转化为必须从系统中移除的热量,从而需要更多的功率。此外,更节能的系统可以插入现有数据中心,而无需昂贵的电气升级。
Fisk 说,能效排名第一并不是主要目标。 “这台计算机将使我们能够使用更智能的技术来做更多的科学工作,这些技术使用更少的电力并有助于实现更可持续的未来,”他说。 “这对我们来说很重要。”
新的 Flatiron Institute 超级计算机取代了位于田纳西州橡树岭国家实验室的前沿测试与开发系统 (TDS),名列能效榜单。 Frontier TDS 在 2022 年 6 月的榜单上设定了极高的标准,达到每瓦 626.84 亿次触发器,而突破 exaFLOP(10 亿次触发器)障碍并仍然是世界上最快的超级计算机的主要 Frontier 系统为 52.227每瓦十亿次触发器。 Fisk 说,取消 Frontier 是一项艰巨的挑战。
虽然两者都是记录创造者,但新的 Flatiron Institute 超级计算机与 Frontier 截然不同,Frontier 经过精心设计和构建以达到 1 exaFLOP。相反,新的 Flatiron Institute 系统利用常用的系统、GPU 和网络,使其“非常高性能和非常高效,而且不会特别奇特,”Fisk 说。 “只需要几个人就可以加载系统。现在,更多的团队可以获得这种效率,而不仅仅是最大的超级计算中心。”
新超级计算机背后的技术的可获得性代表了行业的转变。联想执行副总裁兼公司基础设施解决方案事业部总裁 Kirk Skaugen 表示:“联想致力于为所有行业的各种规模的用户提供相同的百亿亿次级就绪技术。” “我们与 Flatiron 和 NVIDIA 的合作在几乎任何规模的超级计算技术和支持所有人的智能技术方面展示了一个关键的里程碑。”