鹏城云脑II正式发布，中国开启E级AI超算时代

李清泉
2020-04-05 05:43:51 1

鹏城云脑迎来升级！

2019年11月29日，鹏城实验室与华为在深圳联合发布了鹏城云脑II。这是继鹏城实验室主任高文院士在往年的华为全联接大会上介绍鹏城云脑的基本规划后，鹏城云脑的又一次重大进展。

鹏城云脑之所以备受瞩目，一方面是因为它直接对接国家新一代人工智能发展战略和重要科技项目，专注于新一代人工智能基础研究和突破信息处理领域的重大科学问题；另一方面，鹏城云脑的建设标志着多样化计算的重要发展方向，对于未来异构计算的应用和理论具有重要参考价值。

华为高级副总裁、Cloud & AI产品与服务总裁侯金龙与鹏城实验室主任高文出席了鹏城云脑II的发布会。据了解，已建成的鹏城云脑I峰值性能达到100PFLOPS，而鹏城云脑II则是一个能够实现AI算力自由扩展至千P级的AI超算系统。该系统以华为Atlas 900 AI集群为基础，通过多样化的异构计算平台、多源算法平台和多态智能应用，支持AI重要应用的模型训练和推理，应用于自动驾驶、智慧城市、智慧医疗、智慧交通、语音识别和自然语言处理等领域。

如今，鹏城云脑II的正式发布，标志着华为Atlas 900 AI集群将发挥关键作用。这表明鹏城实验室在打造软硬件一体化的人工智能开源开放平台方面迈出了重要一步，同时也是鲲鹏计算产业在科研领域的重要进展。这标志着鲲鹏计算产业全面发力的又一个重要里程碑。

Atlas 900为鹏城云脑II提供最强底座

如果说通用计算是传统的汽油引擎，那么多样化计算则是面向未来的混合动力引擎，它代表着未来计算的重要发展趋势。尤其在自动驾驶、机器视觉和智能语音等大量人工智能应用不断涌现之时，各种神经网络算法和计算架构层出不穷，对多样化异构计算的需求急剧增加。

鹏城云脑作为探索人工智能奥秘和打造先进人工智能技术的基础研究平台，是立足深圳、面向全国的超大规模人工智能科研平台。自鹏城云脑I投入使用以来，平均每天运行超过500个科研任务，支持来自北京大学、清华大学等高校的科研人员开展人工智能相关研究。

为了满足日益增长的AI算力需求，吸引更多科研人员在鹏城云脑上进行研究，鹏城实验室与华为合作建设了鹏城云脑II，采用搭载鲲鹏和昇腾处理器的Atlas 900集群提供充足的算力。华为高级副总裁、Cloud & AI产品与服务总裁侯金龙表示：“今天华为Atlas 900集群系统正式入驻鹏城云脑II，为鹏城云脑II提供坚实的基础。鹏城云脑II是业界领先的AI研究平台，鹏城实验室汇聚了众多院士和优秀的AI研究人员。我们希望通过双方的共同努力，将鹏城云脑II打造成全球领先的AI研究平台。”

华为Atlas 900 AI集群是在今年华为全联接大会上发布的，由数千颗昇腾910 AI处理器组成，是目前全球最快的AI集群之一，代表着当前全球AI算力的顶尖水平。昇腾910 AI处理器是目前全球最快的人工智能处理器，其性能比其他竞争对手高出两倍。

在衡量AI计算能力的ResNet-50图像分类模型下，Atlas 900仅需59.8秒即可完成训练，在同等精度下比原世界纪录快10秒。Atlas 900凭借其强大的算力，可以广泛应用于科学研究和商业创新，例如地理探测、气象预测、自动驾驶和石油勘探等领域。

Atlas 900具有以下三个主要创新特点： - 强大算力：数千颗昇腾910 AI处理器互联，半精度（FP16）算力达到256-1024 PFLOPS，相当于50万台个人电脑的算力；采用SoC设计，整合了AI算力、通用算力和I/O，有效提升了训练效率。 - 高速集群网络：采用HCCS、PCIe 4.0、100G以太网三种高速互联方式，梯度同步延迟缩短10%～70%；独创的iLossless智能无损交换算法，对全网流量进行实时学习和训练，实现网络零丢包和端到端微秒级延迟。 - 高效散热：采用柜级绝热封闭系统，液冷占比超过95%，系统能效比低于1.1。

华为智能计算业务部总裁马海旭表示：“华为Atlas人工智能计算平台基于华为昇腾系列AI处理器，通过模块、板卡、小站、AI服务器和集群等多种形态的产品，打造面向‘端、边、云’的全场景AI基础设施解决方案，覆盖深度学习的推理和训练全过程。Atlas 900作为Atlas系列的旗舰产品，代表了当今全球AI计算的领先水平。我们希望通过Atlas 900与鹏城云脑II的合作，共同建设千P级AI集群应用，为业界提供充足的算力，加速全行业的智能化升级。”

除了Atlas 900 AI集群外，华为还基于昇腾910和310 AI处理器打造了一系列产品，包括Atlas 900 AI集群、Atlas 800 AI服务器、Atlas 500智能小站、Atlas 300 AI加速卡和Atlas 200 AI加速模块等，可以为云、边、端全场景提供强大的算力支持。

鲲鹏计算产业的强音

一个现实：鹏城云脑I是建立在国际GPU巨头产品基础上的，而鹏城云脑II则全面采用了华为Atlas 900 AI集群。这体现了华为AI计算产品的充分认可，也是鲲鹏计算产业全面发力的一个缩影。

众所周知，华为在今年9月正式发布了基于“鲲鹏+昇腾”的计算战略，并开始打造“一云两翼双引擎”的鲲鹏计算产业布局。所谓双引擎指的是围绕“鲲鹏”与“昇腾”打造的两个基础芯片族，构建异构计算架构；而两翼则指智能计算业务以及智能数据与存储业务，智能计算面向端、边、云提供“鲲鹏+昇腾+x86+GPU”的多样化算力，智能数据与存储领域则融合了存储、大数据、数据库和AI，围绕数据的全生命周期让数据成本最优、价值最大；一云是指华为云，成为生态伙伴的黑土地，为世界提供普惠算力。

毫无疑问，在鲲鹏计算产业中，产品和技术是整个产业发展的基石，它们的领先性将决定未来产业能走多远。回顾华为过去一年多的诸多举措，大部分都在围绕多样化计算推出领先业界的产品，以夯实整个鲲鹏计算产业的基础。

以AI处理器为例，华为在2018年推出了昇腾310，今年则推出了昇腾910处理器和全场景AI计算框架MindSpore。其中，用于推理的昇腾310，整型（INT8）算力为16 TOPS，功耗仅为8W；昇腾910半精度（FP16）算力达到256 Tera-FLOPS，整数精度（INT8）算力达到512 Tera-OPS，达到规格算力所需的功耗仅310W；而MindSpore全场景AI计算框架则可以针对不同运行环境进行部署，大幅降低了AI应用开发门槛。

鲲鹏处理器从2007年开始研发，历经12年，今年推出的第三代芯片鲲鹏920是业界首款兼容Arm架构的64核数据中心处理器，性能比业界主流处理器高25%、内存带宽高60%；同时将CPU、桥片、网络和磁盘控制器“四合一”，成为业界集成度最高的数据中心处理器。

在智能数据与存储方面，华为今年推出了全球首款AI-Native数据库GaussDB和OceanStor分布式存储。GaussDB首次将人工智能技术融入分布式数据库的全生命周期，实现了自运维、自管理、自调优、故障自诊断和自愈，并通过异构计算创新框架充分发挥X86、ARM、GPU、NPU等多种算力优势，在权威标准测试集TPC-DS上性能比业界提升50%，排名第一。OceanStor分布式存储首次实现一套存储同时支持块、文件、对象和HDFS协议，单节点性能高达16.8万每秒读写速度（IOPS）和1毫秒以内时延，在业界标准测试SPC-1中排名第一。

实际上，在整个计算架构体系迎来变革之际，计算产业迎来了两万亿的大蓝海机会。华为过去一年多一系列产品的推出，涵盖了从芯片、服务器、存储到操作系统、数据库、计算框架等，已经为鲲鹏计算产业打下了坚实的产品基础。正如华为在去年全联接大会上所言：华为将按照“量产一代、研发一代、规划一代”的节奏投资芯片，持续演进，后向兼容，为产业发展提供长远保障。

除了领先的产品外，华为还采取了硬件开放、软件开源、使能合作伙伴的策略，与合作伙伴共同推动鲲鹏计算产业的发展壮大。

2019年是鲲鹏计算产业的元年，无论是新产品发布还是各种合作策略的推出，更像是华为在为鲲鹏计算产业打基础。而年末鹏城云脑II的发布，就像一个音符，奏响了鲲鹏计算产业全面发力的强音。未来，随着华为产品、解决方案和生态策略的不断完善，鲲鹏计算产业将唱响多样化计算时代的最强音。

图灵汇

责任编辑：：李清泉

声明：本文系图灵汇原创稿件，版权属图灵汇所有，未经授权不得转载，已经协议授权的媒体下载使用时须注明"稿件来源：图灵汇"，违者将依法追究责任。