阿里达摩院开源语音识别模型DFSMN，准确率达96.04%

阿里巴巴达摩院近期发布了新的开源语音识别模型DFSMN，这一模型基于全球最大的免费语音识别数据库LibriSpeech，将全球语音识别准确率提升至96.04%。

据阿里方面介绍，与当前广泛使用的LSTM模型相比，DFSMN模型不仅训练速度更快，而且识别准确率更高。采用DFSMN模型的智能音箱或智能家居设备，在深度学习训练速度上提升了3倍，语音识别速度也提高了2倍。

更多详细信息可以访问开源地址：

https://github.com/tramphero/kaldi

此外，量子位正面向社会招聘编辑和记者，工作地点位于北京中关村。欢迎有才华且充满热情的朋友加入我们的团队！

量子位 QbitAI 是头条号的签约作者。

责任编辑：：杨帅

声明：本文系图灵汇原创稿件，版权属图灵汇所有，未经授权不得转载，已经协议授权的媒体下载使用时须注明"稿件来源：图灵汇"，违者将依法追究责任。

2022-09-03

语音识别技术浅析