在国际科技领域,生成式人工智能和大型模型正引发全球热潮,尤其在2023年世界人工智能大会上(WAIC 2023)展现出了前所未有的热度。各大厂商竞相展示创新成果,超过30个大型模型平台在会上亮相,其中近六成展台着重介绍了生成式AI技术及其应用,而参会者讨论的焦点几乎全集中在大型模型上。
英特尔公司高级首席AI工程师、网络与边缘事业部中国区首席技术官张宇指出,驱动当前人工智能快速发展的重要因素在于计算、通信和存储技术的进步。不论是在大型模型还是融合AI领域,边缘计算都在人工智能生态中占据关键地位。
张宇分析,随着产业数字化转型,市场对快速连接、实时业务处理和应用智能化的需求日益增长,这推动了边缘人工智能的发展。然而,目前边缘人工智能的主要应用仍集中于边缘推理阶段,即通过大量数据和巨大算力在数据中心训练模型,然后将训练结果推送到前端执行推理任务。
值得注意的是,频繁更新模型的需求在某些行业尤为迫切,例如自动驾驶领域,它需要适应多样化的路况和驾驶员行为。然而,训练数据与实际驾驶过程中产生的数据之间存在差异,影响了模型的泛化能力,即对新情境和行为的适应性。为了克服这一挑战,张宇倡导了人工智能发展的下一阶段——边缘训练,旨在通过自动化工具实现从数据标注到模型训练及部署的全流程开发。
边缘人工智能面临多重挑战,除了边缘训练之外,边缘设备的性能和能耗问题尤为突出。受限于有限的算力承载能力,如何在有限资源下实现推理与训练成为一大难题。此外,边缘设备的碎片化现象显著,如何使软件在不同平台上高效迁移成为另一大挑战。
面对海量数据带来的保护需求,如何在边缘部署人工智能时确保模型安全,同时在存储和运行时提供有效保护,成为业界关注的热点。作为一家专注于计算、通信和存储领域的公司,英特尔提供了从CPU、GPU、FPGA到各种人工智能加速芯片的多元产品组合,以满足不同算力需求。特别是在大型模型训练方面,英特尔的Habana Gaudi2产品在业界独树一帜,展现了出色的性能。同时,英特尔的OpenVINO深度学习部署工具套件使得开发者能够将模型快速部署至不同硬件平台,执行推理操作,从而助力边缘人工智能的实践与创新。