为了便于大家将录音转化为文字,去年,捷通华声推出了灵云语音云平台(speech.aicloud.com),为记者、教师、秘书等群体提供收费的录音转写服务。该平台拥有较高的语音识别率,并且具备音字同步校正功能,因此受到了众多用户的欢迎。
近期,灵云语音云进行了重大升级,新增了对英语和四川话的识别功能。通过大量的后台数据分析,该平台对各个专业领域进行了重新分类。用户可以根据需要选择不同的专业领域模型,如通用、政府、教育、金融等,从而提高语音识别的准确性。
多语种语音识别 多领域语音转写
灵云乐识现已支持中文、英文及四川话的语音转写。在普通话识别方面,用户还可以选择更细致的分类,包括但不限于通用聊天、客户服务热线、教育培训、财经投资、党政会议、情感心理、哲学思想、广播电台、企业会议、历史文化、旅游地理、网络课程以及医疗保健等。
选择合适的领域模型,可以显著提升语音识别效果。转写速度非常快,例如1小时的录音几分钟内就能完成。
对于转写出来的结果,用户可以在平台上进行在线编辑。只需点击需要修改的文字部分,系统会立即定位到对应的音频片段,让用户边听边改,极大地提高了编辑效率。
此外,灵云乐识还具备自动过滤语气词和自动分段等功能,全方位优化录音转写的效果,进一步提升了文本整理的效率。转写后的结果可以直接下载或分享给他人。
使用指南
用户可以通过输入网址speech.aicloud.com访问语音云平台,也可以登录灵云平台(www.aicloud.com)并点击语音云服务按钮进入。完成注册后,用户可以免费使用语音云服务。上传音频文件非常简单,只需在网站上点击上传按钮,选择相应的语音识别模型和文件格式(支持mp3、wav、m4a、spx、opus、amr等),然后点击“创建任务”。几分钟后,几小时的录音整理工作就可以轻松完成。
灵云乐说还提供了语音合成服务,用户可以直接将想要合成的文字粘贴或导入到网站上,系统会生成高质量的声音文件,用户可以将这些文件直接导出或分享给他人。