日前,搜狗输入法利用AI语音识别技术和大数据,推出了“个性化语音识别”服务。首批体验过的用户反馈显示,更新后的输入法显著提高了语音输入的准确性,特别是在识别常用人名、地名和习惯用语方面,基本上不需要手动调整,搜狗输入法越来越“懂人心”。
语音输入扩展了手机输入法的应用场景,让用户在不方便手动输入的情况下,可以通过语音快速录入文本。然而,语音识别的精确度直接影响了用户使用的频率和场景。因此,如何有效提升语音识别的准确性,成为输入法行业的核心技术竞争之一。搜狗输入法率先突破了这一技术难题,推出了“个性化语音识别”,显著改善了用户在语音输入时的体验。
同音词组、习惯用语和固定短语一直是语音输入的难点。“个性化语音识别”基于AI语音识别技术和大数据融合,能够准确识别用户的个性化内容,有效提升了包含个人特征词句的识别准确率,减少了用户在语音输入过程中需要手动修正的情况,提高了日常生活中信息传递的效率。
市场上大多数智能设备都支持语音唤醒功能,这是语音识别技术的第一阶段——“听懂”。将语音转化为相应的文字,并且保证转换的准确性,则是语音识别技术的第二阶段——“读心”。
第一阶段已经发展成熟,因为通过算法辅助和程序纠正,即使语音素材不够完整,机器也能大致理解语音的基本含义,并作出相应反应。而第二阶段则需要准确识别用户的个性化语音,避免因“文本歧义”导致误解。
目前,搜狗的通用语音识别系统采用了行业领先的深度学习技术,包括基于DTSS(基于深度变换器的序列到序列模型)、神经网络语言模型和智能标点预测等技术,显著提升了搜狗语音识别的整体效果。此次推出的“个性化语音识别”针对用户的语音输入习惯进行了精准优化,在保证通用识别准确性的基础上,将用户常用词汇的错误率降低了近40%,实现了语音识别第二阶段“读心”的关键技术突破。
语音输入是人机交流的重要桥梁。如今,随着人工智能技术的快速发展和广泛应用,AI智能产品种类不断增多,这表明输入领域需要更加先进的技术革新。搜狗输入法自创立之初就注重与互联网的结合,一直紧跟互联网科技的发展趋势。“个性化语音识别”正是顺应这一趋势的智慧科技成果。
可以预见,在未来人工智能普及的时代,通过搜狗提供的个性化资源,用户的人机自然交互将更加顺畅。此外,“个性化语音识别”还可以根据用户的个人特征和习惯,在智能家居、智能教育、智能医疗等领域为用户构建专属的词汇库,提供更便捷的语音环境。
从大众化到个性化,从满足普遍需求到关注个人特征,在人工智能和机器学习引领的智慧科技时代,精准个性化用户服务已成为互联网科技产品的必备要素。从“听懂”到“读心”,搜狗“个性化语音识别”增强了输入法产品的个性化属性,满足了用户个性化的表达需求,推动了科技时代智慧输入法的新理念。