模型web迁移延时太长，机器学习神器Cortex 能一键处理吗？

AI黑石
2020-02-17 15:22:35 5

+关注

Cortex V0.13 发布：机器学习模型部署更便捷

近日，机器学习算法部署平台Cortex发布了新版Cortex V0.13。该版本支持所有主要的机器学习框架，旨在简化从Jupyter Notebook到生产环境的模型迁移过程。

新版亮点

当前，许多机器学习框架（如TensorFlow、PyTorch）需要特定的技术栈，这使得模型从本地环境迁移到云端的过程变得复杂且耗时。Cortex V0.13的发布解决了这些问题，提供了诸多新功能，显著提升了用户体验。

自动扩展：Cortex可以根据实际负载自动调整API规模，有效避免延迟，同时减少AWS费用支出。

多框架支持：Cortex支持多种机器学习框架，包括TensorFlow、Keras、PyTorch、Scikit-learn和XGBoost。

CPU/GPU支持：用户可以在CPU或GPU环境中运行推理任务，以满足不同的性能需求。

滚动更新：通过滚动更新功能，可以轻松将新模型部署到现有API上，确保服务连续性。

日志流：实时日志查看功能有助于简化故障排查和流程优化。

预测监测：系统可以监控网络性能指标，并追踪预测结果。

Spot实例：利用Spot实例，用户可以获得最高折扣。

最小化配置：Cortex的部署配置仅需一个cortex.yaml文件即可完成。

技术细节

Cortex采用了一系列开源工具，如TensorFlow、Kubernetes和Docker，并结合AWS服务（如CloudWatch），为开发人员提供了一个高效的API部署解决方案。具体来说，它将模型容器化，然后部署到Kubernetes集群上，实现自动扩展和灵活的资源配置。

社区反馈

在Reddit论坛上，Cortex的更新引起了广泛的讨论。一些用户认为Cortex能够显著加快机器学习模型的训练速度，但也有人指出，Cortex在某些功能的支持方面仍有改进空间。例如，有人质疑为何要将Cortex绑定在AWS上，而不支持所有的Kubernetes集群。此外，有人建议增加本地测试功能，以便更好地进行开发和调试。