Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Utilizzalo per CloudFormation creare una politica di scalabilità
L'esempio seguente mostra come configurare la scalabilità automatica del modello su un endpoint utilizzando. CloudFormation
Endpoint: Type: "AWS::SageMaker::Endpoint" Properties: EndpointName:yourEndpointNameEndpointConfigName:yourEndpointConfigNameScalingTarget: Type: "AWS::ApplicationAutoScaling::ScalableTarget" Properties: MaxCapacity:10MinCapacity:2ResourceId: endpoint/my-endpoint/variant/my-variantRoleARN:arnScalableDimension: sagemaker:variant:DesiredInstanceCount ServiceNamespace: sagemaker ScalingPolicy: Type: "AWS::ApplicationAutoScaling::ScalingPolicy" Properties: PolicyName:my-scaling-policyPolicyType: TargetTrackingScaling ScalingTargetId: Ref: ScalingTarget TargetTrackingScalingPolicyConfiguration: TargetValue:70.0ScaleInCooldown:600ScaleOutCooldown:30PredefinedMetricSpecification: PredefinedMetricType: SageMakerVariantInvocationsPerInstance
Per ulteriori informazioni, consulta Create Application Auto Scaling resources con AWS CloudFormation nella Application Auto Scaling User Guide.