1月11日,全球领先云计算提供商阿里云宣布,其第八代企业级通用计算实例ECS g8i的算力再度跃升,国内首发采用代号Emerald Rapids的第五代英特尔至强可扩展处理器。依托阿里云自主研发的「飞天+CIPU」架构体系,ECS g8i实例的整体性能提升了惊人的85%,AI推理性能更是最高可达7倍之多。这一升级使其能够承载高达72B参数级别的大型语言模型,同时大幅降低中小规模模型的建设成本。
“通过ECS g8i实例的性能提升,我们验证了以CPU为核心的计算体系在加速AI推理任务上的巨大潜力。这一成果不仅表明公共云在支持超大规模AI模型方面的能力,也为AI应用的快速落地开辟了新路径。”
“最新推出的第五代英特尔至强可扩展处理器每个内核均内嵌AI加速功能,完全有能力应对复杂AI工作负载。相较于前代产品,AI训练性能提升高达29%,AI推理能力提升42%。我们期待与阿里云合作,共同助力开发者实现技术普惠,使AI技术广泛应用于各个领域。”
作为面向企业级用户的计算实例,ECS g8i在计算、存储、网络和安全性方面实现了全面优化。其L3缓存容量达到了320MB,内存速度高达5600MT/s,整机性能提升85%,单核性能提升25%;存储方面,ESSD云盘提供100万IOPS,全面支持NVMe,存储延迟低至百微秒;网络方面,PPS高达3000万,标配阿里云自研eRDMA大规模加速能力,时延低至8微秒;在安全方面,ECS g8i实例配备了可信计算与加密计算等特性,全球率先支持机密虚拟机TDX技术,构筑了强大的安全防护体系。
面对生成式AI带来的计算范式变革,ECS g8i实例通过内置Intel AMX高级矩阵扩展加速技术,显著提升生成式AI的执行效率,较AVX512指令集性能最高提升7倍。这使得ECS g8i实例能够更高效地运行中小规模参数模型,如知识检索、问答系统及摘要生成等AI工作负载,相比A10 GPU云服务器,建设成本降低了50%。结合阿里云平台的Spot抢占式实例,进一步降低了AI推理的成本。
阿里云在全产品线构建了端到端的安全防护机制,确保数据在存储、传输和计算过程中的安全。通过CIPU的安全架构搭载硬件可信根——TPM,实现服务器的可信启动,保证数据零篡改。在虚拟化层面,支持vTPM,提供实例启动过程核心组件的校验能力,确保实例可信。此外,ECS g8i实例全量支持Trust Domain Extension TDX技术,无需改动业务应用,即可部署到TEE环境中,有效降低技术门槛,保护大模型等AI应用的数据安全。
“阿里云将持续深化技术创新,提供更为稳定、强大、安全、灵活的计算服务,促进各行各业的AI应用进入全面爆发期。”