AI新技术加成，专为输入法打造的“搜狗个性化语音辨认”

2019-08-26 12:56:54 9

日前，搜狗输入法利用AI语音识别技术和大数据，推出了“个性化语音识别”服务。首批体验过的用户反馈显示，更新后的输入法显著提高了语音输入的准确性，特别是在识别常用人名、地名和习惯用语方面，基本上不需要手动调整，搜狗输入法越来越“懂人心”。

依靠AI，语音输入领域率先实现“个性化识别”

语音输入扩展了手机输入法的应用场景，让用户在不方便手动输入的情况下，可以通过语音快速录入文本。然而，语音识别的精确度直接影响了用户使用的频率和场景。因此，如何有效提升语音识别的准确性，成为输入法行业的核心技术竞争之一。搜狗输入法率先突破了这一技术难题，推出了“个性化语音识别”，显著改善了用户在语音输入时的体验。

同音词组、习惯用语和固定短语一直是语音输入的难点。“个性化语音识别”基于AI语音识别技术和大数据融合，能够准确识别用户的个性化内容，有效提升了包含个人特征词句的识别准确率，减少了用户在语音输入过程中需要手动修正的情况，提高了日常生活中信息传递的效率。

利用AI，搜狗语音成为“读心术”

市场上大多数智能设备都支持语音唤醒功能，这是语音识别技术的第一阶段——“听懂”。将语音转化为相应的文字，并且保证转换的准确性，则是语音识别技术的第二阶段——“读心”。

第一阶段已经发展成熟，因为通过算法辅助和程序纠正，即使语音素材不够完整，机器也能大致理解语音的基本含义，并作出相应反应。而第二阶段则需要准确识别用户的个性化语音，避免因“文本歧义”导致误解。

目前，搜狗的通用语音识别系统采用了行业领先的深度学习技术，包括基于DTSS（基于深度变换器的序列到序列模型）、神经网络语言模型和智能标点预测等技术，显著提升了搜狗语音识别的整体效果。此次推出的“个性化语音识别”针对用户的语音输入习惯进行了精准优化，在保证通用识别准确性的基础上，将用户常用词汇的错误率降低了近40%，实现了语音识别第二阶段“读心”的关键技术突破。