在过去的半年里,AI的爆发式发展与大模型产品的涌现,显著推动了AI技术的广泛应用,同时也对云计算产业产生了深远影响。算力作为AI研究与应用的基础,其格局的变化尤为引人注目。2023年,生成式AI研究与应用的迅猛增长为云计算领域带来了前所未有的机遇与挑战。
云计算厂商面临的关键挑战包括满足用户对庞大算力的需求、升级数据中心以应对AI时代的高需求、降低总拥有成本(TCO),以及确保云端数据的安全可靠。这要求云厂商对硬件基础设施进行更新换代,寻求新一代CPU解决方案,以提供高性能、低TCO、满足多样化工作负载需求的AI能力。
为应对上述需求,云服务商在升级硬件时需谨慎决策,倾向于采用具有长期延续性的主流平台,以保护上层软件应用的投资,减少对基础设施开发运维部门的影响。同时,云服务提供商需采取更为严格的安全措施,如部署硬件级安全引擎,以保护敏感数据的安全,确保云实例间的隔离,防止恶意入侵与数据泄露。
英特尔作为服务器CPU领域的领导者,紧跟技术趋势,于近期发布了第五代至强可扩展处理器。这款处理器不仅与上一代产品兼容,提供强大的硬件级安全和可信服务,还能通过丰富的AI产品组合,全面支持AI应用的全生命周期,进一步巩固了其在AI时代的关键地位。
相较于上一代产品,第五代至强可扩展处理器的核心数量大幅增加至64个,单核性能与内存带宽显著提升,三级缓存容量更是提高了近3倍。处理器内置的英特尔AVX-512及AMX技术,极大提升了机器学习、深度学习和大模型应用的性能。同时,其内置的英特尔SGX/TDX技术为使用中的云端数据提供了端到端的硬件级防护,显著提高了系统的安全性。
京东云在数百个AI场景中成功应用了大模型,显著提升了营销购物体验,实现了30%的大促物料生成自动化,商品推荐采纳率高达87%,消费者应答准确率提升了30%。这一成果得益于京东云部署的基于第五代至强可扩展处理器的自研服务器,其整机性能较上一代提升23%,AI CV推理性能与Llama v2大模型推理性能分别提升38%与51%。
火山引擎,作为云计算领域的另一重要玩家,也率先采用了第五代至强可扩展处理器,其第三代弹性计算实例在算力、内存带宽、AI、视频处理性能、Java应用性能等方面均实现了40%左右的性能提升。通过引入英特尔原生硬件加速技术,如Nginx的数据压缩和证书验证操作吞吐量最高可提升5倍,RocksDB中的数据压缩读写吞吐量最高可提升1.9倍,显著增强了火山引擎的性能与效率。
第五代至强可扩展处理器的推出,不仅代表了云计算领域的一次重大技术革新,也为AI应用的广泛普及铺平了道路。通过硬件与软件的协同优化,不仅提升了系统性能与安全性,还降低了用户的使用门槛,助力企业专注于业务创新,把握AI浪潮中的市场机遇。在未来,英特尔将继续携手合作伙伴,推动云计算与AI技术的深度融合,为企业提供更加高效、安全、经济的解决方案,共同开创数字化转型的新篇章。