云+AI,青云QingCloud以AI智算平台简化智算中心运营运维
作者头像
  • 王京
  • 2024-03-05 00:00:00 3089

AI算力需求激增与技术创新

随着AI大模型在行业应用与垂直领域中的广泛应用,对AI算力的需求显著提升。无论是基于通用大模型的微调还是垂直领域的大模型训练,均需大量算力支持,且随着大模型的成熟与落地,对算力的需求持续攀升。

据中国信通院《中国综合算力指数(2023年)》报告,近五年内,我国人工智能算力在整体算力结构中的占比超过25%,较前一年增长60%。未来,算力发展将保持高速增长态势,智能算力预计将成为主要驱动力。

林源视角下的AI机遇与挑战

青云科技CEO林源认为,AI技术不仅为云计算开辟了新的市场增长点,更预示着长达十年以上的需求周期,这是企业展开新一轮竞争的绝佳时机。在国家政策的强力支持下,各地积极推动智算中心建设,旨在促进人工智能公共算力平台的创新发展。与此同时,“东数西算”战略进一步加速了包括智算中心、超算中心在内的算力设施建设,旨在全面提升国家算力水平。

智算中心的挑战与策略

智算中心建设规模庞大,盈利与否关键在于高效运营与平台能力。运营复杂性远超建设阶段,需应对云计算、超算、智算等多元算力的统一调度,以及传统应用、云原生应用、AI应用的兼容性问题。此外,还需解决异构CPU/GPU的高效调度、网络与存储优化、大规模智算中心的运维与运营等挑战。

历史案例与运营经验

过去,某些大型AI项目因缺乏统筹规划和技术经验,导致失败率较高。例如,某大型企业的智算中心因仅支持国产GPU,上线后发现大量应用无法运行,最终未能投入运营。另一超算中心尝试整合智算功能,尽管其超级计算机具备高精度算力,却未适应AI所需的低精度、大规模算力需求,实现这一目标较为困难。

青云科技的成功路径

青云科技在AI算力调度与运营方面积累了深厚的技术与经验,成为行业内的佼佼者。自2019年起,国家超算济南中心作为亚洲领先的计算中心之一,拥有1000P算力与超300PB存储,提供了包括HPC超算、传统云计算(以CPU为主)、智算(兼顾国内外GPU)在内的多元且异构算力服务。该项目的算力调度运营平台由青云科技独家提供,现已稳定运营三年,并开始实现盈利。

成功背后的支撑力量

国家超算济南中心的成功运营,得益于青云科技在长期的技术积累与运营经验上的深耕。青云科技AI智算平台不仅在国家超算济南中心发挥关键作用,还应用于清华天津电子院智算科研教学平台、上海科发SciPlus科研云等场景,成为各类算力中心运营的核心工具,助力构建从建设到运营的完整闭环。

    本文来源:图灵汇
责任编辑: : 王京
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
青云营运简化QingCloud平台中心AI
    下一篇