AI时代，语音输入更精准！搜狗完成“个性化语音辨认”新打破

爱分析ifenxi
2019-08-15 13:21:12 1

搜狗“个性化语音识别”打造专属输入体验

在日常交流中，个人习惯和常用词汇常会影响信息的准确传达，尤其是在人机语音交互中更为显著。例如，当用户想要输入“凭远”时，通用的语音识别系统往往会将“平原”或“品源”排在候选词汇前列，而忽视用户的个性化需求。此外，用户经常使用的特定词汇、多音字以及发音错误也会影响语音识别的效果。

为了改善这些问题，搜狗语音推出了“个性化语音识别”功能，革新了语音识别技术。用户只需在搜狗输入法App中登录个人账户，即可享受这项服务。一旦启用，系统将强化用户习惯使用的个性化词汇，为每位用户创建专属的语音输入法。这样，在需要进行语音输入时，输入法能根据语言环境和上下文进行分析，快速提供符合用户需求的文本内容，减少用户手动修改的频率。

搜狗语音识别更精准，助力高效沟通

搜狗“个性化语音识别”不仅提升了用户个性化词汇的识别准确率，还实现了全自动词库学习，确保系统处理和反馈的速度。整个学习过程可以在“毫秒级别”内自动完成。通过采用DTSS（基于深度变换器的序列到序列模型）、神经网络语言模型和智能标点预测等先进技术，搜狗输入法引入了前沿的深度学习技术，对语音识别进行了仿真模拟和训练，提高了语音输入在通用场景下的识别准确性。目前，搜狗输入法的识别精度已处于行业领先地位。

“个性化语音识别”可以根据用户的数据分析，记录用户习惯使用的个性化词汇。在语音输入时，优先选择用户常用的词汇进行文本输入。这项技术革新不仅保障了通用识别的准确性，还将用户常用词汇的字词错误率降低了40%，解决了语音识别精准化的问题。

从个性化语音识别开启AI新纪元

手和舌头是人类最灵活的两个部位。自移动智能设备兴起以来，各种触控交互都离不开手的操作。然而，当语音技术和人工智能同步发展至成熟阶段时，可能会像《2019年语音技术报告》所描述的那样，语音交互将彻底改变人机交互的方式。用户与设备之间的全新关系将基于语音交互建立，类似于互联网向移动互联网的过渡，这也将催生对底层平台的新需求。

随着人工智能和虚拟现实等新技术的发展，以及多场景应用的需求增加，用户输入习惯正逐渐转向语音输入。与传统的文本输入相比，语音输入将成为最主要的人机交互方式。搜狗通过优化语音识别技术，为用户提供更自然、便捷和高效的语音输入服务，引领智慧输入法的发展趋势。

随着语音识别技术的不断成熟和用户个性化词库的不断丰富，搜狗将整合用户级别的语音个性化资源，实现“定制化语音输入法”。未来，每个用户都能基于“定制版”的搜狗语音识别，提高日常生活以及医疗、法律等专业领域中的线上交流和人机沟通效率和准确性，成为人工智能时代输入端的全球领导者。

图灵汇

责任编辑：：爱分析ifenxi

声明：本文系图灵汇原创稿件，版权属图灵汇所有，未经授权不得转载，已经协议授权的媒体下载使用时须注明"稿件来源：图灵汇"，违者将依法追究责任。