微软开放视频/语音识别API:让每个应用都能闻声识人
作者头像
  • 和新哲
  • 2022-05-22 10:58:03 4

微软在今年的Build大会上宣布了Project Oxford项目。这是一套REST API和SDK工具包,旨在帮助开发者构建智能化的应用程序。借助这套工具包,开发者可以利用微软的自然语言处理算法,为他们的解决方案添加智能服务。

11月12日,微软开放了包括表情识别和拼写检查在内的多个智能API,并承诺将在年内推出语音识别和视频处理的新API预览。如今,微软兑现了这一承诺。微软对这两个新API的描述如下:

“语音识别API将允许用户通过语音完成特定任务。尽管这项功能不能替代指纹或虹膜扫描等强认证方式,但它可以作为一种辅助手段来增强安全性。此外,该功能还能改善客户服务体验,通过自动识别客户的声音,从而无需再通过其他方式确认客户身份。”

“视频API简化了视频的分析和编辑过程,还利用微软的视频处理算法来检测视频中的人脸。通过稳定背景的方法,它可以检测到视频中的运动状态,从而使视频更加平稳和稳定。”

    本文来源:图灵汇
责任编辑: : 和新哲
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
闻声微软语音识别每个开放应用视频API
    下一篇