阿里云第八代企业级实例g8i算力升级:整机性能提升85%,AI推理最高提速7倍
作者头像
  • 杨天瑞
  • 2024-01-11 00:00:00 3053

导读:

1月11日,全球领先云计算提供商阿里云宣布,其第八代企业级通用计算实例ECS g8i的算力再度跃升,国内首发采用代号Emerald Rapids的第五代英特尔至强可扩展处理器。依托阿里云自主研发的「飞天+CIPU」架构体系,ECS g8i实例的整体性能提升了惊人的85%,AI推理性能更是最高可达7倍之多。这一升级使其能够承载高达72B参数级别的大型语言模型,同时大幅降低中小规模模型的建设成本。

阿里云弹性计算产品线总经理张献涛指出:

“通过ECS g8i实例的性能提升,我们验证了以CPU为核心的计算体系在加速AI推理任务上的巨大潜力。这一成果不仅表明公共云在支持超大规模AI模型方面的能力,也为AI应用的快速落地开辟了新路径。”

英特尔中国数据中心和人工智能集团至强客户解决方案事业部总经理李亚东补充道:

“最新推出的第五代英特尔至强可扩展处理器每个内核均内嵌AI加速功能,完全有能力应对复杂AI工作负载。相较于前代产品,AI训练性能提升高达29%,AI推理能力提升42%。我们期待与阿里云合作,共同助力开发者实现技术普惠,使AI技术广泛应用于各个领域。”

通用算力全面提升,整体性能飞跃85%

作为面向企业级用户的计算实例,ECS g8i在计算、存储、网络和安全性方面实现了全面优化。其L3缓存容量达到了320MB,内存速度高达5600MT/s,整机性能提升85%,单核性能提升25%;存储方面,ESSD云盘提供100万IOPS,全面支持NVMe,存储延迟低至百微秒;网络方面,PPS高达3000万,标配阿里云自研eRDMA大规模加速能力,时延低至8微秒;在安全方面,ECS g8i实例配备了可信计算与加密计算等特性,全球率先支持机密虚拟机TDX技术,构筑了强大的安全防护体系。

助力AI加速,兼容72B参数大模型

面对生成式AI带来的计算范式变革,ECS g8i实例通过内置Intel AMX高级矩阵扩展加速技术,显著提升生成式AI的执行效率,较AVX512指令集性能最高提升7倍。这使得ECS g8i实例能够更高效地运行中小规模参数模型,如知识检索、问答系统及摘要生成等AI工作负载,相比A10 GPU云服务器,建设成本降低了50%。结合阿里云平台的Spot抢占式实例,进一步降低了AI推理的成本。

构建可信AI应用,安全防护升级

阿里云在全产品线构建了端到端的安全防护机制,确保数据在存储、传输和计算过程中的安全。通过CIPU的安全架构搭载硬件可信根——TPM,实现服务器的可信启动,保证数据零篡改。在虚拟化层面,支持vTPM,提供实例启动过程核心组件的校验能力,确保实例可信。此外,ECS g8i实例全量支持Trust Domain Extension TDX技术,无需改动业务应用,即可部署到TEE环境中,有效降低技术门槛,保护大模型等AI应用的数据安全。

张献涛总结:

“阿里云将持续深化技术创新,提供更为稳定、强大、安全、灵活的计算服务,促进各行各业的AI应用进入全面爆发期。”

    本文来源:图灵汇
责任编辑: : 杨天瑞
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
八代阿里企业级提速整机推理实例提升性能最高
    下一篇