摘要:12月7日凌晨,科技巨头谷歌在推出多模态大型模型Gemini的同时,亦发布了全新的云端AI加速器TPU v5p。这款设备是谷歌至今为止功能最强大的且性价比最高的云端张量处理单元(TPU)。据透露,每个TPU v5p Pod由高达8,960个芯片组成,采用了最高带宽的芯片间连接技术,确保了高速数据传输和优化性能。
技术创新:与前一代TPU相比,TPU v5p在性能上实现了显著提升,FLOPS(每秒浮点运算次数)增加至459 TFLOPs(Bf16格式)或918 TOPs(Int8格式),同时,高带宽内存容量达到95GB,数据传输速度可达2.76 TB/s。此代设备的内存带宽相较于上一代TPU v4提高了3倍,浮点运算能力也提升了2倍。
效能增强:在AI模型训练方面,TPU v5p展示了惊人的进步,尤其是在大语言模型(LLM)训练速度上,较之TPU v4实现了2.8倍的提升,相比TPU v5e则约提高了50%。谷歌还优化了计算能力,使得TPU v5p每个Pod的总可用FLOP可扩展性较TPU v4高出了4倍。
软件生态:谷歌在软件层面也进行了优化,通过广泛支持流行的机器学习框架(如JAX、TensorFlow和PyTorch),并利用OpenXLA编译器进行调优,确保了TPU v5p的高效运行。此外,软件资源包括多片训练和多主机推理软件,简化了扩展、训练和服务工作负载的流程,支持数千个芯片的高效协同工作。
集成优势:谷歌的AI超级计算机整合了高性能计算、优化存储和液体冷却等特性,旨在最大化TPU v5p的潜力,从而提供了业界领先的性能。与Google Kubernetes Engine (GKE)和Google Compute Engine的深度集成,进一步提升了资源管理效率、操作一致性以及服务的可靠性。
展望未来:谷歌在AI领域的革新性举措,特别是通过TPU v5p与AI超级计算机的结合,有望推动AI开发的边界,激发更多创新应用。随着这些技术的普及,预计将在竞争激烈的AI市场中引发新一轮的竞争高潮。
编者注:本文由芯智讯-浪客剑撰写。