微软开放视频/语音识别API：让每个应用都能闻声识人

微软在今年的Build大会上宣布了Project Oxford项目。这是一套REST API和SDK工具包，旨在帮助开发者构建智能化的应用程序。借助这套工具包，开发者可以利用微软的自然语言处理算法，为他们的解决方案添加智能服务。

11月12日，微软开放了包括表情识别和拼写检查在内的多个智能API，并承诺将在年内推出语音识别和视频处理的新API预览。如今，微软兑现了这一承诺。微软对这两个新API的描述如下：

“语音识别API将允许用户通过语音完成特定任务。尽管这项功能不能替代指纹或虹膜扫描等强认证方式，但它可以作为一种辅助手段来增强安全性。此外，该功能还能改善客户服务体验，通过自动识别客户的声音，从而无需再通过其他方式确认客户身份。”

“视频API简化了视频的分析和编辑过程，还利用微软的视频处理算法来检测视频中的人脸。通过稳定背景的方法，它可以检测到视频中的运动状态，从而使视频更加平稳和稳定。”

责任编辑：：和新哲

声明：本文系图灵汇原创稿件，版权属图灵汇所有，未经授权不得转载，已经协议授权的媒体下载使用时须注明"稿件来源：图灵汇"，违者将依法追究责任。

2022-05-22

给同音口头禅来个“私人定制”搜狗输入法首推个性化语音识别