2018年10月,中国人民银行发布了《移动金融基于声纹识别安全应用技术规范》,这是中国金融行业首个生物识别技术标准。这一标准的出台标志着我国语音识别技术开始迈入产业化的新阶段。
语音识别技术主要研究语音信号处理,属于模式识别的一个分支,涉及生理学、心理学、语言学、计算机科学以及信号处理等多个领域。此外,它还涵盖了人类的身体语言,例如人在说话时的表情和手势等行为动作。语音识别技术的最终目标是实现人机之间的自然语言交流。
中国的语音识别研究一直紧随国际水平,国家高度重视,并将大词汇量语音识别研究纳入“863”计划。中科院声学研究所、自动化研究所及北京大学等单位共同参与了这项研究。
自20世纪四五十年代以来,经过长期的研究和探索,声纹识别技术逐渐走向成熟,并迎来了最佳的应用和发展期。2018年,全球语音识别技术市场规模达到6.83亿美元。
2018年可以说是语音识别技术迈向产业化的重要节点,其中最具标志性的事件是中国人民银行发布的《移动金融基于声纹识别安全应用技术规范》。这是中国金融行业的首个生物识别技术标准,其影响力深远,不仅解决了声纹识别技术进入金融领域的标准问题,也为坚持初心的企业注入了动力。这一年也因此被称为“声纹元年”。
该标准由中国建设银行、清华大学和北京得意音通技术有限责任公司联合发起,历经三年的研究和论证,最终由央行批准发布。标准制定过程中,央行科技司主导,多家银行、国家级评测机构及第三方支付平台共同参与了标准的完善工作。
标准中对技术要求和管理做出了明确的规定,包括声纹注册、验证、变更、登记等环节的基本需求,以及采样、抗噪音、防攻击、抗时变等技术要求。同时,对声纹信息的采集、传输、存储、处理和删除等全生命周期进行了规范。
声纹识别行业的市场竞争可以大致分为三个阶段:
2018年5月,花旗银行宣布在中国市场推出“声纹验证”服务,其技术供应商是曾经为苹果提供Siri技术支持的国际语音行业老牌厂商Nuance。
此后,其他外资企业如ValidSoft和Nice也开始进入中国金融市场,但市场份额有限。整体来看,以得意音通为代表的本土企业在中国市场占据相对优势。
(注:本文为改写后的内容,未包含原图和具体来源信息)