同花顺在ASRU2019中英混杂语音辨认应战赛获得佳绩
作者头像
  • 隽蔚展览
  • 2019-11-26 20:04:21 2

同花顺AI研究所在ASRU2019中英混杂语音识别挑战赛中取得佳绩

凭借多年在语音识别领域的技术和项目经验积累,同花顺AI研究院的语音团队在ASRU2019中英混杂语音识别挑战赛中取得了优异成绩。在赛事设置的三个赛道中,该团队均表现突出,特别是在端到端语音识别赛道中荣获季军,同时在传统语音识别(开放语言模型和固定语言模型)两个赛道也表现出色。

同花顺AI研究院首席科学家兼语音技术专家胡新辉认为,能够同时参与三个赛道并取得好成绩,表明同花顺AI研究院在中英文混杂语音识别方面的建模基础扎实,覆盖面广,适应性强,已达到业界领先水平。基于这些技术及其在语音合成、声纹识别及说话人分离等领域的其他成果,同花顺有信心继续为语音相关的产品和服务注入新的能力。

ASRU2019中英混杂语音识别挑战赛推动多语言混杂语音识别研究

ASRU2019中英混杂语音识别挑战赛由数据堂、西北工业大学和中国计算机学会联合主办,旨在促进多语言混杂语音识别的研究和技术交流。该赛事吸引了来自国内外近百支队伍参赛,其中包括多家在语音识别领域具有卓越研究成果的企业和高校。获奖团队将在2019年12月的新加坡ASRU2019会议上接受颁奖和技术交流。

竞赛展示同花顺AI研究院的研发实力

随着社会的国际化进程,中文语境下夹杂英文单词的现象日益增多。这种语音识别技术被称为语种混杂(Code-switch)识别技术,是当前语音识别技术面临的重大挑战之一。其主要技术难题包括:嵌入语受到主体语的影响导致非母语口音严重、不同语言音素间的差异给混合声学建模带来巨大挑战、带标注的混合语音训练数据极为稀缺。

与传统语音识别建模方式相比,端到端语音识别减少了建模步骤,实现了从声学特征到文本输入的直接建模。同花顺采用的端到端模型系统以谷歌的Transformer网络为基础,引入了CTC/注意力结合训练方式,提高了模型训练的鲁棒性和收敛速度。同时,针对语种混杂任务的特殊性,引入了语种识别作为辅助训练任务,辅以数据扩增、正则化参数调整等优化技术,最终实现了中英文混合识别端到端模型,以9.00%的综合错误率获得第三名的成绩。值得一提的是,该系统对英语的识别效果尤为出色。

相比之下,第二个赛道重点考察了语音建模和数据处理能力。面对资源匮乏的中英混杂识别任务,如何实现数据扩增以达到较高的识别率成为关键问题。同花顺通过多种方法组合对文本数据进行了有效扩增,最终以5.88%的识别错误率排名第四。

语音技术的应用前景广阔

同花顺语音团队的目标是构建全方位的语音技术能力,利用语音的交互便捷性和自然性为产品和业务创造新动力,提升产品竞争力,为用户创造更大价值。此次竞赛不仅提升了团队的研发能力,还验证了同花顺在端到端语音识别系统、自主语音建模和数据处理能力上的领先地位。未来,同花顺可以根据不同用户的需求定制更合适的模型,真正做到“懂你所想,思你所思”。

同花顺正在稳步扩展海外市场,本次竞赛的目标正好契合公司业务发展的需求。语音技术的进步能够迅速应用于各种场景,相信将为公司发展注入持久动力。此外,同花顺AI研究院在语音识别、语音合成、声纹识别和语种识别等基础研究方向上的技术能力已经得到广泛应用,包括同花顺手机炒股、小象来电、智能客服、智能外呼和质检等产品和服务,得到了充分验证。特别是在金融领域,得益于长期积累的数据优势,同花顺的语音识别功能已达到行业领先水平。

    本文来源:图灵汇
责任编辑: : 隽蔚展览
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
花顺应战佳绩混杂辨认中英语音ASRU2019获得
    下一篇