索尼、爱国者、纽曼的录音笔,都接入了搜狗的语音辨认服务
作者头像
  • 赵春孟
  • 2019-08-29 13:46:23 3

郭一璞 发自 大望路

量子位 报道 谷歌通过Android操作系统,让其他手机厂商也能使用这一系统,并融入其生态系统。微软则通过Windows操作系统,使众多PC厂商能够接入,形成统一的Windows生态。现在,搜狗也计划采取类似的策略。

搜狗不仅关注手机和PC市场,还将目光投向了录音笔这一硬件领域。搜狗正式推出搜狗听写功能,并与多家厂商合作,首批合作伙伴包括万城集团、索尼、爱国者和纽曼。这意味着,未来消费者购买这些品牌中任意一家生产的具备搜狗听写功能的录音笔后,都可以使用统一的交互方式来操作,并借助搜狗听写功能实现语音转文字、同声传译及文本编辑等功能。

此外,这些厂商无需专门进行适配,搜狗听写功能可以直接兼容他们的设备。这几乎相当于一个操作系统。

打通搜狗输入法,支持在线编辑

搜狗听写功能的具体功能包括:

  • 语音转写:准确率高达95%,搜狗的语音识别技术每天处理的请求量达到6亿次。
  • 搜狗输入法集成:用户可以使用搜狗输入法中的个性化词库,包括常用的专业词汇、人名地名等,提高识别准确性。
  • 多端同步编辑:无论是在PC、安卓还是iOS设备上,用户都可以同步录音和转写的文字,并进行编辑。该功能还支持声纹识别,能够自动区分不同说话人的角色,避免出现无角色区分的大段文字。此外,对于转写不确定的部分,搜狗听写服务会提供多个备选项,避免手动逐字修改。
  • 云存储服务:用户的所有录音和转写内容都将保存在云端,便于随时查阅和管理。

接入手机和PC端

除了录音笔外,搜狗听写功能还可以应用于移动设备和PC端。例如,手机端的搜狗录音助手App集成了转写和同传功能,并对蓝牙协议开放。在PC端,即使录音笔未接入搜狗听写功能,只要连接到电脑的USB接口,用户也可以利用搜狗输入法管理和转写录音笔中的录音。

另外,当录音笔连接到PC时,由于使用的是用户的搜狗输入法账号,其中存储的个性化词汇(如朋友的名字、专业术语等)会被调用,从而提高转写结果的准确性。例如,如果你是《长安十二时辰》的粉丝,经常使用搜狗输入法输入剧中相关词汇,那么在语音转文字时,系统能够识别出“伏火雷”这样的专业词汇。同样,如果你是一名机器学习研究者,系统也能识别出“卷积神经网络”这样的专业术语。

此外,语音转文字的速度也得到了保障。一个小时的录音大约需要五分钟即可完成转写。

开放服务,而非技术

在搜狗听写功能的发布会上,搜狗宣布与万城集团、索尼、爱国者和纽曼共同成立“AI创新联盟”。搜狗CTO杨洪涛认为,传统的录音笔只提供录音功能,而用户在整理录音时仍需手动记录,过程非常繁琐。因此,通过语音识别技术和搜狗输入法的结合,可以提供更丰富的服务,打破录音笔行业的局限,满足企业会议、学习培训、媒体采访和写作记事等多种需求。

简单来说,以前人们觉得整理录音很麻烦,甚至不愿意购买录音笔。但现在,如果整理录音变得简单,人们就能更方便地整理会议上的讲话、课堂上的知识点,甚至直接用语音输入来写作。这样,更多人会选择购买录音笔。

搜狗并没有选择建立一个开发者平台,让所有开发者都能够通过API接入,而是选择了开放服务。杨洪涛表示:“开放的是服务,不是技术。”他认为市场上已经有很多语音识别API,搜狗希望通过自己的优势,提供具有产业价值和商业价值的服务。

此外,搜狗公司AI交互技术中心总经理王砚峰透露,未来搜狗还将逐步开放更多具有竞争力的技术和服务,如AI分身、变声、同传等,为用户提供更加完善的体验。

    本文来源:图灵汇
责任编辑: : 赵春孟
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
纽曼索尼录音笔辨认爱国者接入搜狗语音服务
    下一篇