提速至极限:谷歌优化策略显著提升稳定扩散模型生成速度
近期,谷歌在图像生成技术领域取得了突破,为知名模型“稳定扩散”(Stable Diffusion)提供了优化方案,显著加快了其生成图片的速度。这一革新不仅推动了模型在设备端的运行成为可能,还为本地生成人工智能应用铺平了道路。
“稳定扩散”模型以其惊人的速度生成逼真的图像而闻名,然而,面对数十亿参数的挑战,它对计算资源和内存的需求极高,难以在非云环境中运行。谷歌的优化策略解决了这一难题,使稳定扩散模型得以在移动设备上高效执行。
借助精心设计的策略,谷歌成功地提升了稳定扩散模型的运行效率,使得包括iPhone和安卓在内的移动设备上实现图像生成变得可行。苹果公司的优化工作进一步提升了iPad和Mac等设备的图像生成速度,谷歌自身亦贡献了创新性的优化方法,旨在改善稳定扩散模型的性能。
谷歌发布的一篇题为《提速至极限:通过GPU意识优化在设备上加速大型扩散模型》的论文,揭示了通用优化策略,适用于所有扩散模型,而不局限于特定设备。研究团队在三星手机上进行了GPU测试,仅需11.5秒即可完成20次迭代,生成512*512分辨率的图像,达到顶尖推理延迟表现。
为了加速模型运行,研究人员提出三项优化措施:采用分组归一化(GN)与高斯误差线性单元(GELU),优化注意力模块;引入IO感知的精确注意力算法,以减少计算操作和内存消耗;利用Winograd卷积,将卷积运算转化为矩阵乘法,有效减少计算次数。
通过在多种设备上的基准测试,谷歌证明了优化策略能够大幅减少延迟时间,甚至达到行业领先水平。这一系列革新意味着稳定扩散等扩散模型的生成速度得到了显著提升,有望在未来推动更多设备端本地生成AI应用的实现。
欲了解更多详情,推荐阅读以下文章:
- 安卓设备刷新稳定扩散模型记录,实现15秒内生成图像
- 探索稳定扩散模型的优化路径,加速图像生成过程