Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Se utiliza AWS CloudFormation para crear una política de escalado
En el siguiente ejemplo se muestra cómo configurar el escalado automático de modelos en un punto de conexión mediante AWS CloudFormation.
Endpoint: Type: "AWS::SageMaker::Endpoint" Properties: EndpointName:yourEndpointNameEndpointConfigName:yourEndpointConfigNameScalingTarget: Type: "AWS::ApplicationAutoScaling::ScalableTarget" Properties: MaxCapacity:10MinCapacity:2ResourceId: endpoint/my-endpoint/variant/my-variantRoleARN:arnScalableDimension: sagemaker:variant:DesiredInstanceCount ServiceNamespace: sagemaker ScalingPolicy: Type: "AWS::ApplicationAutoScaling::ScalingPolicy" Properties: PolicyName:my-scaling-policyPolicyType: TargetTrackingScaling ScalingTargetId: Ref: ScalingTarget TargetTrackingScalingPolicyConfiguration: TargetValue:70.0ScaleInCooldown:600ScaleOutCooldown:30PredefinedMetricSpecification: PredefinedMetricType: SageMakerVariantInvocationsPerInstance
Para obtener más información, consulte Create Application Auto Scaling resources with AWS CloudFormation en la Guía del usuario de Application Auto Scaling.