今天,橡树岭国家实验室的 Frontier 超级计算机在半年一度的Top500 榜单中名列全球最快。 Frontier 的速度比上一个冠军拥有者日本的 Fugaku 超级计算机的速度提高了一倍多,并且是第一个官方时钟速度超过每秒 50 亿次计算的计算机——这是一个里程碑式的计算已经追求了 14 年。
这是一个很大的数字。因此,在我们继续之前,值得用更人性化的术语来描述。
想象一下,给地球上所有 79 亿人一支铅笔和一张简单算术或乘法问题的清单。现在,请大家在四年半的时间里每秒解决一个问题。通过整理地球人口五年来的数学技能,您现在已经解决了五亿个问题。
Frontier 可以在一秒钟内完成相同的工作,并且可以无限期地保持下去。地球上每个人进行一千年的算术运算,Frontier 只需要不到四分钟。
这种惊人的性能开启了被称为百亿亿次计算的新时代。
Exascale 时代
计算机每秒解决的浮点运算或简单数学问题的数量表示为 FLOP/s 或通俗地称为“触发器”。进度以一千的倍数进行跟踪:一千次翻牌等于一千次翻牌,一百万次翻牌等于一兆翻牌,依此类推。
1997 年,ASCI Red 超级计算机率先记录了 1 万亿次或 teraflop 的速度。(值得注意的是,Xbox Series X 游戏机现在可以达到12 teraflops 。)Roadrunner 在 2008 年首次打破了 petaflop 的障碍,达到了 1 万亿次。 . 从那时起,最快的计算机一直以 petaflops 为单位进行测量。 Frontier 是第一个正式将速度超过 exaflop(准确地说是 1.102 exaflops)的公司,大约比 Roadrunner 快 1,000 倍。
的确,今天的超级计算机比旧机器快得多,但它们仍然占据整个房间,一排排柜子里布满了电线和芯片。特别是 Frontier 是 Cray 的液冷系统,运行 873 万个 AMD 处理内核。除了是世界上最快的以外,它也是第二高效的——仅被由其中一个机柜组成的测试系统所超越——额定值为 52.23 gigaflops/watt。
那么,有什么大不了的?
大多数超级计算机都是由政府机构资助、建造和运营的。科学家们用它们来模拟物理系统,比如宇宙的气候或结构,也被军方用于核武器研究。
超级计算机现在也可以运行最新的人工智能算法。事实上,几年前,Top500 增加了一个新的低精度基准来衡量人工智能应用程序的超级计算速度。到那时, Fugaku早在 2020 年就超过了 exaflop。Fugaku 系统以 2 exaflops 创下了机器学习的最新记录。 Frontier 以 6.86 exaflops 的 AI 速度打破了这一纪录。
随着近年来出现非常大的机器学习算法,私营公司开始与政府一起建造自己的机器。微软和 OpenAI 在 2020 年凭借他们声称世界第五快的机器成为头条新闻。 1 月份,Meta 表示其即将推出的 RSC 超级计算机将以 5 exaflops 的速度成为世界上 AI 速度最快的计算机。 (看来他们现在需要更多筹码来匹配 Frontier。)
Frontier 和其他私人超级计算机将允许机器学习算法进一步突破极限。当今最先进的算法拥有数千亿个参数或内部连接,但即将推出的系统可能会增长到数万亿个。
因此,无论是人工智能还是建模,Frontier 都将允许研究人员以更详细和更快的速度推进技术进步并进行尖端科学。
Frontier 真的是第一台 Exascale 机器吗?
超级计算究竟何时首次突破 exaflop 障碍,部分取决于您如何定义它以及测量的内容。
Folding@Home 是一个由各种各样的志愿笔记本电脑组成的分布式系统,在大流行开始时就打破了 exaflop 。但根据 Top500 联合创始人 Jack Dongarra的说法,Folding@Home 是一个“令人尴尬地并行”的专业系统,只适用于可以完全独立解决的问题。
更相关的是,去年有传言称中国有多达两台百亿亿级超级计算机在秘密运行。去年年底,研究人员在论文中公布了这些机器的一些细节,但它们尚未被 Top500 正式对标。在去年 12 月的一次IEEE Spectrum采访中,Dongarra 推测,如果中国存在 exascale 机器,政府可能会避免将焦点放在它们身上,以防止引发可能导致美国限制关键技术出口的地缘政治紧张局势。
因此,中国有可能击败美国达到百亿亿次重击,但通过 Top500(自 1990 年代初以来超级计算领域用来确定领头羊的基准),Frontier 仍然获得官方认可。
下一步:Zettascale?
从 terascale 到 petascale 用了大约 12 年,再到 exascale 用了 14 年。下一次大跃进可能需要更长或更长时间。计算行业在芯片上继续稳步前进,但步伐放缓,每一步都变得更加昂贵。 摩尔定律并没有死,但它不像以前那么稳定了。
对于超级计算机来说,挑战不仅仅是原始计算能力。看起来您应该能够扩展任何系统以达到您喜欢的任何基准:只要让它更大。但规模也需要效率,否则能源需求就会失控。编写软件来并行解决越来越大的系统中的问题也变得更加困难。
下一个 1000 倍的飞跃,被称为 zettascale,将需要芯片、将它们连接到超级计算机的系统以及在其上运行的软件方面的创新。一组中国研究人员预测,我们将在 2035 年达到 zettascale 计算。但当然,没有人真正确切地知道。之前预计将在2018 年或2020 年到达的百亿亿次级,比原计划晚了几年。
更确定的是,对更大计算能力的渴望不会减少。消费者应用(如自动驾驶汽车和混合现实)以及研究应用(如建模和人工智能)将需要更快、更高效的计算机。如果需求是发明之母,那么您可以期待一段时间内更快的计算机。
图片来源:橡树岭国家实验室 (ORNL)