自动扩缩¶
Knative Serving 为应用程序提供自动扩缩容(或称 *autoscaling*),以匹配传入需求。默认情况下,这是通过使用 Knative Pod 自动扩缩容器 (KPA) 来提供的。
例如,如果一个应用程序没有收到流量且启用了扩缩容到零,Knative Serving 会将应用程序缩减到零个副本。如果禁用了扩缩容到零,应用程序将被缩减到为集群上的应用程序指定的最小副本数。如果应用程序流量增加,副本数量会向上扩展以满足需求。
如果您具有集群管理员权限,可以为集群启用和禁用“扩缩容到零”功能。请参阅 配置扩缩容到零。
要在集群上启用了自动扩缩容的情况下将其用于您的应用程序,您必须配置 并发度 和 扩缩容边界。
额外资源¶
- 试用 Go 自动扩缩容示例应用。
- 配置您的 Knative 部署以使用 Kubernetes 水平 Pod 自动扩缩容器 (HPA),而不是默认的 KPA。关于如何安装 HPA,请参阅 安装可选的 Serving 扩展。
- 配置自动扩缩容器所使用的指标类型。