我已经使用sklearn.deploy方法在AWS Sagemaker中部署了一个sklearn模型,用于自动缩放端点。我已经设置了以下配置:
Target value for number of requests: 25
Scale out cool time: 30 sec
Scale in cool time: 20 sec收到发送的25+请求后,将部署一个新实例。但在此之后,即使我不向端点发送新请求,它也不会自动缩减。
为什么它不缩容?
当在固定时间间隔内没有收到新请求时,如何使其自动缩容。
发布于 2020-07-08 00:28:09
在写这篇文章的时候,SageMaker不会缩小到0。
You must also specify the minimum number of instances for the model. This value must be at least 1, and equal to or less than the value specified for the maximum number of endpoint instances.
来源:https://docs.aws.amazon.com/sagemaker/latest/dg/endpoint-auto-scaling-prerequisites.html
https://stackoverflow.com/questions/62038211
复制相似问题