2023年6月25日,英特尔公司宣布,其与美国能源部及慧与(HPE)合作的Aurora超级计算机已在阿贡国家实验室完成部署,该计算机配备了英特尔数据中心GPU Max系列,具备2 Exaflops的FP64算力,成为全球首台峰值性能可达每秒200亿亿次计算的超级计算机,且其性能持续稳定在1 Exaflops的FP64水平。
Aurora超级计算机采用英特尔至强Max系列处理器与数据中心Max系列GPU,共包括10624个刀片服务器节点,每个节点装备两个具有HBM的至强Max处理器与六个数据中心Max GPU。这使得Aurora拥有21248个至强Max系列处理器,总计11万个核心;以及63744个GPU,特别适用于高性能计算与人工智能场景。这些GPU在实际科学与工程任务中的表现优于AMD MI250X GPU,且能几乎线性扩展至数百个节点。
英特尔至强Max系列处理器独有将HBM集成于x86架构的能力,在多项关键应用领域展现出40%的性能优势。此外,Aurora集成的存储系统使用英特尔开源的分布式异步对象存储(DAOS),提供高达220PB的容量与31TB/s的带宽,依托HPE Slingshot高性能网络,支持大量数据集的处理,如核聚变研究、科学工程、物理模拟与天气预测等任务。
Aurora将为应对气候变化、药物研发等需求提供强大计算资源,作为推动科技突破的重要工具。预计在即将发布的TOP500榜单中,Aurora将占据显著位置。在验收测试阶段,研究人员将利用Aurora训练大型开源生成AI模型,以加速科学研究进程。
Aurora的部署过程复杂而精密,每个重达70磅的刀片服务器需要专用机械进行吊装,最终安置于冰箱大小的机架内,构成166个机架的整体布局,占地面积相当于两个专业篮球场。这一系统不仅展现了先进的硬件配置,同时也体现了高效的安装与管理策略。
Aurora的部署标志着超级计算领域的重大进展,作为全球首台达到2 Exaflops算力的超级计算机,其不仅代表了当前技术的巅峰,也为未来科学研究提供了前所未有的计算能力。通过整合英特尔至强Max系列处理器与数据中心Max系列GPU,Aurora不仅提升了整体性能,还展示了在人工智能与高性能计算领域的卓越潜力。