云天励飞论文入选ACL24：SPACE引擎引领大模型推理无损加速时代

在国际计算语言学界盛大的年度盛会——第62届国际计算语言学年会上，中国科技企业云天励飞展示了其前沿研究。该公司的论文《革新与验证：通过智能平行自动校正解码加速大型语言模型推理》因其创新贡献而被选为大会“Findings”长文系列的一部分，彰显了其在大型语言模型推理领域的先进探索。

作为计算语言学与自然语言处理领域的一流学术论坛，国际计算语言学年会由国际计算语言学协会主办，每年在不同国家举办，且被中国计算机学会纳入A类会议推荐名单，凸显了其在学术界的权威地位。

云天励飞的论文聚焦于名为SPACE的革新引擎，旨在优化大型语言模型推理过程，实现高效加速。实验证明，SPACE引擎在性能评估基准测试集上表现出显著提速效果，最高可达270%至400%之多，同时保证了推理结果的高质量，实现了速度与精度的完美平衡。

SPACE引擎的核心技术在于“智能并行自动纠错解码”，它巧妙地结合半自回归推理模型与验证机制，既提升了推理速度，又确保了输出精度。半自回归方法作为一种权衡策略，在自回归与非自回归间找到平衡点，既提高了效率，又维持了输出质量。

面对传统自回归推理面临的挑战，即需要对大型模型进行重新训练以适应半自回归方案，SPACE引擎通过半自回归监督微调与自动修正解码，使得大型模型能够在单次推理中生成并验证多个结果，大幅缩短了推理时间。

相较于传统自回归推理，SPACE引擎的推理流程如同一场接力赛，每名选手（推理步骤）在完成自己的任务后立即进行验证。一旦验证通过，即可迅速确认结果并继续下一轮，显著提升了整体效率。

SPACE引擎不仅适用于所有大型语言模型，还通过微调与优化，最大化利用并行计算资源，提高推理效率。此外，它还能与其它加速技术协同工作，进一步提升性能。

在大模型的实际应用中，云天励飞已取得显著成果。通过推出DeepEdge10边缘推理芯片与IPU-X6000加速卡，以及自主研发的云天天书大模型，公司已在多个行业成功部署，促进了大模型技术在真实场景中的广泛应用。

展望未来，云天励飞将继续深耕大模型技术研发与应用推广，为各行各业提供创新解决方案，引领科技前沿。

责任编辑：：无人机之家

声明：本文系图灵汇原创稿件，版权属图灵汇所有，未经授权不得转载，已经协议授权的媒体下载使用时须注明"稿件来源：图灵汇"，违者将依法追究责任。

2024-08-14

中科悦信——芸医宝：功能医学的革新力量，让未来健康触手可及！