阿里巴巴达摩院近期发布了新的开源语音识别模型DFSMN。该模型基于全球最大的免费语音识别数据库LibriSpeech,将语音识别准确率提升至96.04%,刷新了世界纪录。
相比当前广泛使用的LSTM模型,DFSMN模型在训练速度和识别精度方面都有显著优势。采用这一新型模型的智能音箱和智能家居设备,在深度学习训练速度上提升了3倍,语音识别速度也提高了2倍。
有兴趣了解更多详情的读者,可以访问开源项目地址:
https://github.com/tramphero/kaldi
此外,量子位正面向社会招聘编辑和记者,工作地点位于北京中关村。欢迎有才华、有激情的朋友加入我们的团队。如需了解更多信息,请关注量子位公众号(QbitAI),并在对话框内输入“招聘”获取详细信息。
量子位是头条号的签约作者。