在日常交流中,个人习惯和常用词汇常会影响信息的准确传达,尤其是在人机语音交互中更为显著。例如,当用户想要输入“凭远”时,通用的语音识别系统往往会将“平原”或“品源”排在候选词汇前列,而忽视用户的个性化需求。此外,用户经常使用的特定词汇、多音字以及发音错误也会影响语音识别的效果。
为了改善这些问题,搜狗语音推出了“个性化语音识别”功能,革新了语音识别技术。用户只需在搜狗输入法App中登录个人账户,即可享受这项服务。一旦启用,系统将强化用户习惯使用的个性化词汇,为每位用户创建专属的语音输入法。这样,在需要进行语音输入时,输入法能根据语言环境和上下文进行分析,快速提供符合用户需求的文本内容,减少用户手动修改的频率。
搜狗“个性化语音识别”不仅提升了用户个性化词汇的识别准确率,还实现了全自动词库学习,确保系统处理和反馈的速度。整个学习过程可以在“毫秒级别”内自动完成。通过采用DTSS(基于深度变换器的序列到序列模型)、神经网络语言模型和智能标点预测等先进技术,搜狗输入法引入了前沿的深度学习技术,对语音识别进行了仿真模拟和训练,提高了语音输入在通用场景下的识别准确性。目前,搜狗输入法的识别精度已处于行业领先地位。
“个性化语音识别”可以根据用户的数据分析,记录用户习惯使用的个性化词汇。在语音输入时,优先选择用户常用的词汇进行文本输入。这项技术革新不仅保障了通用识别的准确性,还将用户常用词汇的字词错误率降低了40%,解决了语音识别精准化的问题。
手和舌头是人类最灵活的两个部位。自移动智能设备兴起以来,各种触控交互都离不开手的操作。然而,当语音技术和人工智能同步发展至成熟阶段时,可能会像《2019年语音技术报告》所描述的那样,语音交互将彻底改变人机交互的方式。用户与设备之间的全新关系将基于语音交互建立,类似于互联网向移动互联网的过渡,这也将催生对底层平台的新需求。
随着人工智能和虚拟现实等新技术的发展,以及多场景应用的需求增加,用户输入习惯正逐渐转向语音输入。与传统的文本输入相比,语音输入将成为最主要的人机交互方式。搜狗通过优化语音识别技术,为用户提供更自然、便捷和高效的语音输入服务,引领智慧输入法的发展趋势。
随着语音识别技术的不断成熟和用户个性化词库的不断丰富,搜狗将整合用户级别的语音个性化资源,实现“定制化语音输入法”。未来,每个用户都能基于“定制版”的搜狗语音识别,提高日常生活以及医疗、法律等专业领域中的线上交流和人机沟通效率和准确性,成为人工智能时代输入端的全球领导者。