数字经济的浪潮中,算力作为核心生产力,正成为驱动全社会数字化和智能化转型的关键基石,扮演着数字时代不可或缺的核心角色。算力大致分为三类:基础算力、智能算力和高性能计算算力。基础算力依托CPU芯片,智能算力则以GPU芯片为核心,而高性能计算算力则是通过融合CPU和GPU芯片实现。随着云计算技术的深化发展,AI、5G、物联网技术日益成熟,智慧政务、能源、金融、生物医药、工业仿真、无人驾驶、航空遥感等领域对高性能计算的需求日益增长,推动了算力智能化升级的趋势。
面对智算中心建设中面临的挑战,如多元算力难以统一管理、应用跨平台利用受限、存储效率低下、一体化数据中心运维复杂等问题,青云科技抓住数字化转型、信创产业发展及AI技术变革的机遇,依托云计算技术进步和市场需求,不断优化算力设施相关能力。为此,青云科技推出青云AI智算平台和AI算力云服务,旨在以多样化的算力支持企业的数字化革新。
青云AI智算平台整合异构基础设施管理、数据存储运维、高性能分布式网络等能力,具备自主创新、功能完备、智能运维、成熟运营、开源开放、安全合规、中立可靠、灵活部署等优势。其关键能力包括灵活调度、高速并行存储、分布式调度与管理、多区多业务资源整合、算法开发支持、混合组网、容器推理服务平台、模型仓库(MaaS)、AI训练平台等,能够统一管理多种异构服务器、存储、安全设备,对云计算平台、容器平台、高性能计算平台、AI平台的多元算力进行统一调度管理,实现算力的高效整合与优化。
目前,青云AI算力调度平台已在国家超算济南中心成功实施,助力该中心构建山河云服务模式。在资源调度方面,青云AI智算平台通过一系列优化措施,包括统一镜像模式、算法优化通信链路、最大化系统利用率、利用Kubernetes实现调度策略、支持异构平台、动态灵活的资源调度等,有效提升了算力的调度效率。
在高速并行存储方面,青云AI智算平台通过青云存储U10000的对象存储能力构建统一的数据存储底座,采用数据生命周期分层策略降低成本;并通过并行文件存储EPFS满足大规模节点同时访问需求;在推理场景下,文件存储NAS提供多机DPU计算所需的标准化文件接口。
在混合组网能力方面,青云AI智算平台支持跨区域高速网络互联,实现不同资源池之间的互联互通,提供独立计算和存储IB网,保障业务网络安全隔离,确保数据传输的安全性和效率。
综上所述,青云AI智算平台通过技术创新和优化,为企业提供了全面、高效、安全的算力解决方案,助力各行业实现数字化转型和智能化升级。