NVIDIA将其深度学习加速架构与arm整合推进机器学习端计算应用

张娇
2018-03-29 10:14:57 3032

NVIDIA与ARM携手推动终端AI计算

在2018年3月27日的GTC大会上，NVIDIA首席执行官黄仁勋宣布了与ARM的合作计划，旨在整合NVIDIA的深度学习加速架构（NVDLA）与ARM的机器学习平台Project Trillium。这一战略整合旨在为行动设备、物联网等终端AI应用的开发者提供一套高效且易于更新的软硬件一体化解决方案。

Project Trillium是由ARM推出的机器学习解决方案，专为包括智能手机、平板电脑、传感器和IoT设备在内的各种终端装置设计，旨在加速人工智能（AI）依赖的神经网络运算。通常情况下，AI应用不仅依赖于云中心的大规模数据中心进行训练，还需要在终端设备（如汽车、手机）上实时执行推理任务。通过针对特定算法进行优化，不仅能够显著提升AI应用的响应速度，还能有效节省终端设备的能耗，实现节能减排的目标。

ARM与AI的融合策略

Project Trillium被视为ARM在智能移动设备处理器市场取得领先地位后，通过AI应用向物联网领域扩张的关键战略举措。此次合作不仅让NVIDIA得以进一步扩展其深度学习加速器架构的应用范围，同时也为深度学习推理处理器提供了一条标准化设计的道路。ARM计划于2018年4月公布Project Trillium的相关工具包预览，并在同年中正式发布搭载新技术的产品。

对开发者生态系统的促进

对NVIDIA现有的开发者生态系统而言，与ARM的合作意味着能够利用诸如TensorRT等框架，将已训练的机器学习模型快速部署至终端设备（通过OTA更新处理器负责加速神经网络运算的任务）。这将加速AI应用的持续优化进程，使学术界或社区开发的最新AI应用能够通过推送更新直接部署到终端设备上。对于物联网和移动设备市场而言，结合NVIDIA在深度学习领域的深厚积累和ARM在该市场的领导地位，这一知识产权合作预计将加速AI推理应用的推进。