百度语音辨认和语音合成实战

南都兄弟
2019-11-26 09:28:06 2

+关注

概述

近年来，随着人工智能技术的发展，越来越多的产品希望集成语音功能。然而，语音识别并非易事，因此许多大型互联网公司纷纷推出各自的语音识别解决方案。本文将重点介绍百度的语音识别和语音合成功能。

要使用百度的语音功能，首先需要注册一个百度云账号，并登录百度云平台。在百度云平台上选择“人工智能”，然后点击“语音识别”。

点击后会进入一个新的页面，页面上有两个按钮：“立即体验”和“技术文档”。为了使用语音产品，可以点击“立即体验”。

如果这是首次使用，那么应用数量将为零，此时需要先创建一个新的应用。在创建过程中，需要填写应用名称、应用类型以及所需功能。创建完成后，系统会生成AppID、API Key和Secret Key，这些信息需要妥善保存。

接下来，可以访问百度的语音文档，了解详细的使用方法。百度提供的语音识别API是一个REST API接口，支持多种编程语言。本文将以Python为例，演示如何使用百度的语音识别和语音合成功能。

语音识别

要使用Python实现百度语音识别，需要先安装百度语音SDK包。可以通过执行以下命令来安装：

bash pip install baidu-aip

假设有一段名为output.wav的音频文件，采样率为16000Hz且为单声道格式。使用以下代码进行语音识别：

```python from aip import AipSpeech import wave

def getpcmfrom_wav(filename): wav = wave.open(filename, 'rb') return wav.readframes(wav.getnframes())

APPID = '你的AppID' APPKEY = '你的app key' SECRET_KEY = '你的Secret Key'

client = AipSpeech(APPID, APPKEY, SECRETKEY) pcmcon = getpcmfromwav('output.wav') res = client.asr(pcmcon, 'pcm', 16000, {'dev_pid': 1536}) print(res) ```

运行脚本后，输出结果可能类似于：

json { 'corpus_no': '6763268067273881154', 'sn': '172374735471574696057', 'err_no': 0, 'err_msg': 'success.', 'result': ['这是一个语音测试'] }

语音合成

使用百度语音合成也非常简单。以下是示例代码：

```python from aip import AipSpeech import os

APPID = '你的AppID' APPKEY = '你的app key' SECRET_KEY = '你的Secret Key'

client = AipSpeech(APPID, APPKEY, SECRET_KEY) result = client.synthesis('请把我的文字直接播放', 'zh', 1, {'vol': 5})

if not isinstance(result, dict): with open('tts.mp3', 'wb') as f: f.write(result) os.system('play tts.mp3') ```

执行上述代码后，会在计算机中播放“请把我的文字直接播放”这句话。

以上代码在Ubuntu 16.04系统中已调试通过。

郑重声明：本文为原创作品，转载时请注明来源“头条号：物联网电子世界”。

图灵汇

责任编辑：：南都兄弟

声明：本文系图灵汇原创稿件，版权属图灵汇所有，未经授权不得转载，已经协议授权的媒体下载使用时须注明"稿件来源：图灵汇"，违者将依法追究责任。

语音辨认实战合成百度

隽蔚展览

2019-11-26

概述

语音识别

语音合成

同花顺在ASRU2019中英混杂语音辨认应战赛获得佳绩