11月 08
  1. 今天
  2. 星期五
09:00
grade

在AI领域的热门应用ChatGPT成功累积了1亿用户后,其商业策略逐渐明晰。昨日,ChatGPT推出了API服务,为企业提供了一种付费接入的途径,这一举措将成本降低了90%,至每75万单词只需2美元。

除了API服务的发布,ChatGPT还同步推出了语音转文字的API功能。这一创新基于其强大的Whisper大模型技术,于去年9月首度亮相Whisper Large-v1版本,随后在12月公开了升级版的Whisper Large-v2模型。

此次商业化运作,Whisper API的收费标准极为亲民,每分钟仅需0.006美元,换算成人民币大约为4分钱。这一定价预计将给众多依赖语音技术的企业带来巨大压力。

Whisper API不仅具备将语音文件转换为文字的能力,还能实现多种语言的翻译,包括但不限于英语、中文、阿拉伯语、日语、德语和西班牙语等多种语言,覆盖范围广泛。

然而,不同语言的转录准确度存在显著差异。Whisper Large-v2模型在处理西语、英语、意大利语、德语等语言时,其单词错误率能够控制在5%以内,使得后续的文字修正工作相对轻松。相比之下,中文的转录情况则不尽如人意。其中,v1模型的错误率为19.6%,而升级后的v2模型也仅略有改善,错误率降至14.7%,仍远高于英文、西语等其他语言,导致用户在使用过程中可能需要进行更多的校正工作。

造成这一现象的原因,除了中文本身的复杂性之外,训练数据的局限性也是一个关键因素。由于网络上的内容主要以英文为主,这可能影响了模型在处理中文时的表现。

来源:快科技