提起语音识别,我们很容易联想到那些不会讲笑话的语音助手,比如Siri。而电影《Her》中关于语音识别和控制的情节更是让人印象深刻。只需一句话,就能控制所有家电开关,或者仅仅说出歌名就能播放音乐……人类一直梦想着能与生物乃至机器进行自然的语音交流,而如今,人工智能的快速发展已经使这一梦想成为现实。
[b]语音识别技术的应用广泛,已经渗透到我们日常生活的方方面面。[/b]
[b]科技热词解析[/b]
[b]#语音识别技术#[/b]
简而言之,语音识别技术就是利用计算机将语音信号自动转换成文本的技术,即把声音信号转化为文字的过程。
这项技术涉及多个领域,包括信号处理、模式识别、概率论、信息论、发声机理、听觉机理以及人工智能等。此外,还包括体态语言的应用,如人们在说话时的表情和手势等行为动作可以帮助对方更好地理解。
语音识别的应用范围非常广泛,例如语音输入系统、语音控制系统、智能对话查询系统等。
[b]核心技术[/b]
[b]▼▼▼[/b]
①信号处理及特征提取模块:此模块的任务是从输入信号中提取特征,以便供声学模型处理。同时,该模块通常还包括一些信号处理技术,以尽量减少环境噪声、信道干扰、说话人差异等因素对特征提取的影响。
②统计声学模型:典型的系统大多采用基于一阶隐马尔科夫模型的方法进行建模。
③发音词典:发音词典包含系统能够处理的所有词汇及其发音。发音词典实际上提供了声学模型建模单元与语言模型建模单元之间的映射关系。
④语言模型:语言模型对系统所针对的语言进行建模。理论上,包括正则语言、上下文无关文法等在内的多种语言模型都可以作为选择,但当前大多数系统普遍采用基于统计的N元文法及其变体。
⑤解码器:解码器是语音识别系统的核心部分之一,其任务是根据声学模型、语言模型和词典,从输入信号中寻找能够以最大概率输出该信号的词串。
[b]语音控制技术正在迅速发展,语音助手的实用性和趣味性也在同步提升。[/b]
随着大数据、机器学习、云计算、人工智能等技术的进步,语音识别正在逐步解放我们的双手,语音输入也越来越有可能取代鼠标和键盘。
2018年的高交会上,在信息技术与产品展区,包括思必驰、智能机器人研究院、深鉴科技等在内的多家知名企业将展示最新的语音识别技术。
[b]全链路智能对话定制平台[/b]
展位号:[b]1B40[/b]
思必驰凭借多年的智能语音技术积累,以Dialogue为核心,结合图形用户界面(GUI)和语音用户界面(VUI),自主研发了全链路智能对话定制平台——DUI。DUI为开发者提供高度定制的人机对话解决方案,助力传统厂商实现智能化升级,为创新企业提供核心交互能力。思必驰还首创了启发式智能交互技术和复杂结构知识管理技术,推出了新型对话机器人定制平台——会话精灵。会话精灵通过人机交互领域的前沿技术研究,为企业提供真正的交互式智能助理服务。
[b]笛卡尔高效语音识别引擎[/b]
展位号:[b]1A35[/b]
该语音识别引擎利用深鉴科技独特的深度压缩技术,能够在保持精度的同时将神经网络压缩超过10倍,并部署在深鉴科技自主研发的笛卡尔架构硬件平台上。其核心加速引擎可以显著降低语音识别延迟,同时降低功耗。根据单句语音识别重复测试结果,DDESE端到端语音识别的计算速度是同等级GPU的两倍,其中LSTM部分的加速比超过2.5倍。这款产品主要用于语音识别场景,为用户提供端到端的语音识别加速服务。
[b]欢迎来到高交会,亲身体验人机互动的魅力。[/b]
点击[b]阅读原文[/b]了解更多信息。