百度语音辨认新算法准确率提升超30%,鸿鹄芯片彰显AI落地新打法
作者头像
  • 朱洁
  • 2019-11-29 12:39:12 2

机器之心报道

近日,在北京举行的百度语音技术论坛上,百度展示了其在语音技术领域的最新进展,并公开了百度鸿鹄芯片的最新成果。此次发布的成果不仅突显了百度在语音技术上的持续创新,还展示了其在推动AI落地应用方面的全新策略。

百度CTO王海峰博士在论坛上透露,百度的语音技术每天的调用量已突破100亿次。此外,百度大脑现已开发了228种AI能力,吸引了超过150万开发者使用,成为国内最大的AI开放平台之一。王海峰博士还介绍了百度在AI领域的两大目标:“进化”和“赋能”。通过不断的技术升级,推动AI的发展,同时通过赋能合作伙伴和开发者,构建一个充满活力的AI生态系统。

此次论坛上,百度重点展示了其语音识别新算法及百度鸿鹄芯片的最新进展。这些技术无疑是对“进化”和“赋能”理念的最佳诠释。

端到端深度学习重塑语音识别

百度语音首席架构师贾磊介绍了百度近期在语音技术上的突破,其中最为瞩目的是基于复数CNN网络的语音增强和语音识别一体化建模技术。

现有的语音识别方案主要分为两个步骤:信号处理和语音识别。然而,这种方法存在不少局限。首先,语音增强算法往往侧重于改善听觉感知,而非直接提升识别率。其次,用户需要先唤醒设备,且在识别过程中说话人的位置必须保持固定,否则识别准确率会显著下降。

百度的新算法则无需唤醒步骤。它利用复数CNN网络捕捉多种声音特征,包括不同麦克风输入信息的特征和跨频率耦合的声学特征。这一过程实现了前端声源定位、波束形成和信号增强,随后直接进行声学建模并生成最终的文字结果。这种端到端的方法不仅提高了识别准确率,还能更好地应对多声源环境。

据贾磊介绍,该算法的识别准确率提升了超过30%,特别是在与百度鸿鹄AI芯片结合使用时,效果更加显著。此外,百度还在语音转文字领域发布了SMLTA算法的最新成果,该算法支持更多方言和中英文混合输入,进一步提升了用户体验。

百度鸿鹄芯片:硬件助力算法落地

百度鸿鹄芯片是百度首款专为语音技术设计的AI芯片,旨在加速语音识别技术的应用。百度AI技术生态部总经理喻友平表示,该芯片集成了所有与语音相关的功能,包括波束定位、语音信号增强、回声消除、降噪和语音识别等。这使得百度鸿鹄芯片能够提供完整的解决方案。

目前,百度鸿鹄芯片已经推出了相关的硬件模块,包括安卓开发板等。同时,百度邀请了合作伙伴展示集成百度鸿鹄芯片的智能家电产品,如创维智能电视等,展示了语音识别技术带来的新交互体验。此外,百度还开发了一款基于百度鸿鹄芯片的智能音箱原型,采用了双麦克风结构,集成了所有的语音功能。

专用芯片促进技术普及

百度鸿鹄芯片的设计充分考虑了深度学习的需求,具备大内存、高并行计算能力和快速模型加载的特点。相比通用ARM架构芯片,百度鸿鹄芯片在功耗上更具优势,待机状态下的功耗不到100毫瓦,符合中国节能家电的标准。

贾磊指出,此次发布的端到端算法在百度鸿鹄芯片上仅需200KB的内存即可实现终端语音识别功能。这意味着,通过提供硬件和算法的组合,百度可以将语音能力赋予合作伙伴和开发者,实现整体解决方案的开源开放。

软件驱动硬件设计

百度通过“软件驱动硬件设计”的策略,定制了专用硬件设备,以满足特定算法的需求。相比传统芯片厂商,百度的专用芯片是根据模型的大小、特性和计算方式量身定制的,只有掌握算法细节的厂商才能开发出来。

这种方式的优势在于算法可以与硬件深度结合,通过硬件的开放性融入各种应用场景,发挥最佳性能。此外,专用芯片降低了算法落地的成本,例如,百度鸿鹄芯片整合了语音识别的所有功能,提供了综合解决方案,使合作商不必担心算法运行和硬件适配的问题。

总之,百度通过一系列技术创新和策略调整,不仅在语音技术领域取得了显著进展,还探索了新的AI落地模式。百度鸿鹄芯片的推出标志着百度正在通过定制化硬件来加速AI技术的应用,同时也降低了合作方的门槛,进一步推动了AI生态的发展。

    本文来源:图灵汇
责任编辑: : 朱洁
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
鸿鹄准确率打法辨认彰显算法落地语音芯片提升
    下一篇