离线语音辨认技术品鉴——功能不同各有千秋
作者头像
  • 完颜礼祥
  • 2019-11-19 10:40:20 1

近日,Google推出了一款全新的离线语音识别模型。该模型移除了被称为“解码器图形”的部分,这部分类似于书籍中的索引,用于匹配音频信号与文字。然而,这款模型目前仅在Gboard应用程序中使用,且仅限于Pixel设备,并且只支持美式英语。

业内专家指出,语音识别是当前智能手机的重要功能之一,包括Siri、Alexa和Google在内的智能助手都依赖于此。然而,这些系统存在一个显著问题,即响应时间较长,用户需要等待虚拟助手处理查询,且快速说话时容易产生误解。为了改善这一状况,Google花了五年时间研究并优化了用于语音识别的新AI系统。

与此同时,深圳的轻生活科技有限公司也推出了相关技术产品——离线语音识别模块QLIFE-ASR06M和QLIFE-ASR01M。与Google的产品不同,轻生活科技的模块具备离线声纹识别、背景降噪以及回声消除等功能。这些模块主要面向智能家居行业的制造商,提供低成本、无风险、快速实现产品智能化的服务。

尽管两家公司都在推广离线语音识别技术,但它们各自的功能和特点有所不同。

接下来,我们详细了解一下轻生活科技的离线语音识别模块:

QLIFE-ASR06M 特点:

  1. 模块在10米范围内可达到95%以上的本地语音识别率。
  2. 支持中文和英文两种语言。
  3. 支持大约100条离线指令。
  4. 单麦克风,支持降噪功能。
  5. 支持回声消除功能。
  6. 核心部件可直接连接麦克风和扬声器。
  7. 14个GPIO端口,可用于多种功能复用。
  8. 语音识别响应时间为200-800毫秒。

QLIFE-ASR01M 特点:

  1. 支持34种中英文及其他语种的非特定人声语音命令词识别。
  2. 支持自定义命令集,可设置自定义唤醒词,支持语音响应,便于与主MCU通信。
  3. 内置麦克风偏置及自动增益算法,单麦克风输入也能支持3-5米远场识别。
  4. 支持睡眠级唤醒功能及低功耗管理。
  5. 支持录音和播放功能,可替代传统语音芯片。
  6. 支持多个语音唤醒词及连续命令模式。
  7. 还支持其他可自定义的功能。
  8. 小尺寸:26x22x3毫米。
  9. 支持贴片和插接方式(2.0毫米),灵活便捷。
  10. 核心设备非常简单,只需接入麦克风和扬声器,单电源供电即可满足基本需求。
  11. 可直接驱动8欧姆1瓦特的扬声器,用于语音识别回应。
  12. UART接口返回语音识别结果,便于调试和系统集成。
  13. 可通过UART指令扩展功能。
    本文来源:图灵汇
责任编辑: : 完颜礼祥
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
品鉴各有千秋辨认语音不同功能技术
    下一篇