阿里达摩院开源语音辨认模型DFSMN,准确率达96.04%
作者头像
  • 泽熙洲
  • 2020-07-19 14:25:06 0

阿里巴巴达摩院近期发布了一个新的开源语音识别模型——DFSMN。该模型基于世界上最大的免费语音识别数据库LibriSpeech开发,将全球语音识别准确率提升到了96.04%。

据阿里方面介绍,与当前广泛使用的LSTM模型相比,DFSMN模型不仅训练速度快,而且识别准确率更高。采用这一新模型的智能音箱或智能家居设备,在深度学习训练速度上提升了3倍,语音识别速度也提高了2倍。

如果您想了解更多关于该模型的信息,可以访问其开源地址:

https://github.com/tramphero/kaldi

此外,量子位正在招聘编辑和记者,工作地点位于北京中关村。欢迎有才华且充满热情的朋友加入我们的团队。详情请关注量子位公众号(QbitAI),并在对话框内输入“招聘”二字获取更多信息。

量子位是头条号签约作者,致力于报道人工智能领域的最新动态和技术趋势。

    本文来源:图灵汇
责任编辑: : 泽熙洲
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
达摩阿里准确率辨认开源语音模型96.04DFSMN
    下一篇