在2018年3月27日的GTC大会上,NVIDIA首席执行官黄仁勋宣布了与ARM的合作计划,旨在整合NVIDIA的深度学习加速架构(NVDLA)与ARM的机器学习平台Project Trillium。这一战略整合旨在为行动设备、物联网等终端AI应用的开发者提供一套高效且易于更新的软硬件一体化解决方案。
Project Trillium是由ARM推出的机器学习解决方案,专为包括智能手机、平板电脑、传感器和IoT设备在内的各种终端装置设计,旨在加速人工智能(AI)依赖的神经网络运算。通常情况下,AI应用不仅依赖于云中心的大规模数据中心进行训练,还需要在终端设备(如汽车、手机)上实时执行推理任务。通过针对特定算法进行优化,不仅能够显著提升AI应用的响应速度,还能有效节省终端设备的能耗,实现节能减排的目标。
Project Trillium被视为ARM在智能移动设备处理器市场取得领先地位后,通过AI应用向物联网领域扩张的关键战略举措。此次合作不仅让NVIDIA得以进一步扩展其深度学习加速器架构的应用范围,同时也为深度学习推理处理器提供了一条标准化设计的道路。ARM计划于2018年4月公布Project Trillium的相关工具包预览,并在同年中正式发布搭载新技术的产品。
对NVIDIA现有的开发者生态系统而言,与ARM的合作意味着能够利用诸如TensorRT等框架,将已训练的机器学习模型快速部署至终端设备(通过OTA更新处理器负责加速神经网络运算的任务)。这将加速AI应用的持续优化进程,使学术界或社区开发的最新AI应用能够通过推送更新直接部署到终端设备上。对于物联网和移动设备市场而言,结合NVIDIA在深度学习领域的深厚积累和ARM在该市场的领导地位,这一知识产权合作预计将加速AI推理应用的推进。
NVIDIA与ARM的强强联合,通过Project Trillium平台的整合,为终端AI计算领域带来了创新性的解决方案,旨在提升AI应用的效率、响应速度和能源利用效率,同时加速AI技术的普及和应用。这一合作有望推动AI技术在物联网、移动设备等领域的发展,为开发者生态系统带来更多的机遇。