7月30日,阿里AI在CVPR 2019举办的低功耗图像识别挑战赛(LPIRC)中取得了在线图像分类任务的第一名。这一成果表明,阿里AI能够在手机等轻量级设备上高效地识别百万图像。
CVPR是计算机视觉领域的重要学术会议,而LPIRC挑战赛由IEEE RC项目发起,旨在评估AI在低功耗设备上的图像识别性能。该挑战赛从识别准确率、执行速度和能耗三个方面进行考核。
阿里AI参与了在线图像分类任务,比赛使用Pixel 2手机,要求AI在10分钟内分类20000张图像,主要考察其分类速度和精度。
比赛中,阿里AI使用了Imagenet数据集进行训练,学习了约120万张图像,分类精度达到了67.4%,比官方基准高出3.5%。最终测试中,阿里AI实现了23毫秒的单张图片分类速度,位列第一。
这项技术可以将深度学习算法压缩40至100倍,方便部署在端侧设备上,适用于智能手机、自动驾驶、工业自动化等多个领域。
传统的深度学习模型结构复杂且参数量巨大,必须依赖云平台的强大算力来运行。若要部署在端侧设备上,则需要体积大、能耗高的硬件支持。例如,无人车在行驶过程中需要实时处理大量数据,部分数据在云端处理,部分在本地处理。相比于云端计算,本地计算可以减少时延影响,但受限于功耗,其处理能力有限。
阿里达摩院的线下智能团队为端侧AI提供了解决方案。他们基于当前主流的移动端轻量级网络,设计了一个快速小型网络,即使在低分辨率图像输入的情况下也能保持较高的分类精度。通过量化技术,该模型还可以进一步压缩,在几乎不影响精度的情况下提升速度。
如果将此算法应用于无人车,可以在不增加功耗的前提下大幅提升处理器性能,或者在不降低性能的情况下显著降低功耗,甚至将部分云端任务转移到本地处理。
目前,这项技术已经应用于卫星遥感影像分析中。遥感影像通常以GB为单位,传统的人工分析可能需要数月时间,而AI仅需几分钟即可完成同样的任务。部署在GPU服务器、TX2端上盒子等设备上的低功耗图像识别技术,能够以极高的精度和速度处理海量图像。