AWS最近对其数据库服务Amazon Aurora进行了更新,使其能够更好地与机器学习服务SageMaker和Comprehend结合使用。这样,用户可以直接利用存储在数据库中的结构化数据进行机器学习操作,而无需编写额外的应用程序来处理数据的提取、格式转换及传输至机器学习模型等工作。
企业若想通过机器学习获取分析结果,通常会面临一个挑战:如何高效地建立应用与模型之间的数据传输通道。开发人员需要创建应用程序,将数据从存储位置提取出来,进行必要的转换,然后传递给机器学习模型,最后将预测结果应用于实际业务场景。这一过程往往既复杂又耗时,尤其是考虑到数据在数据库间的导入导出还涉及到安全性与合规性问题。
为了简化关系数据库中数据的机器学习应用,Amazon Aurora现在原生集成了两个AWS机器学习服务:Amazon SageMaker(用于构建、训练和部署自定义机器学习模型)和Amazon Comprehend(用于分析文本)。借助SQL函数,开发者可以直接在查询中调用这些机器学习服务,例如使用Comprehend分析客户反馈的情感,或者利用SageMaker评估客户的忠诚度。此外,开发者还可以将机器学习服务产生的数据保存到新的表中,或者直接用于应用程序中。
AWS表示,无论是Amazon Aurora新推出的机器学习功能,还是Amazon QuickSight在非结构化数据存储Amazon S3上的商业智能服务,其目的都是为了减少将机器学习预测功能集成到应用程序中的障碍。
当前,Amazon Aurora已全面支持与SageMaker的集成,但与Comprehend的集成仍处于预览阶段,仅限于Aurora MySQL 5.7版本使用。不过,官方宣布Aurora MySQL 5.6及Aurora PostgreSQL 10和11版本也将很快支持这一功能。此外,此服务可在所有底层服务均可用的区域使用,且不会产生额外费用,只需支付底层服务的费用即可。