微软在今年的Build大会上宣布了Project Oxford项目。这是一套REST API和SDK工具包,旨在帮助开发者构建智能化的应用程序。借助这套工具包,开发者可以利用微软的自然语言处理算法,为他们的解决方案添加智能服务。
11月12日,微软开放了包括表情识别和拼写检查在内的多个智能API,并承诺将在年内推出语音识别和视频处理的新API预览。如今,微软兑现了这一承诺。微软对这两个新API的描述如下:
“语音识别API将允许用户通过语音完成特定任务。尽管这项功能不能替代指纹或虹膜扫描等强认证方式,但它可以作为一种辅助手段来增强安全性。此外,该功能还能改善客户服务体验,通过自动识别客户的声音,从而无需再通过其他方式确认客户身份。”
“视频API简化了视频的分析和编辑过程,还利用微软的视频处理算法来检测视频中的人脸。通过稳定背景的方法,它可以检测到视频中的运动状态,从而使视频更加平稳和稳定。”