Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Gunakan AWS CloudFormation untuk membuat kebijakan penskalaan
Contoh berikut menunjukkan cara mengonfigurasi penskalaan otomatis model pada titik akhir menggunakan. AWS CloudFormation
Endpoint: Type: "AWS::SageMaker::Endpoint" Properties: EndpointName:yourEndpointNameEndpointConfigName:yourEndpointConfigNameScalingTarget: Type: "AWS::ApplicationAutoScaling::ScalableTarget" Properties: MaxCapacity:10MinCapacity:2ResourceId: endpoint/my-endpoint/variant/my-variantRoleARN:arnScalableDimension: sagemaker:variant:DesiredInstanceCount ServiceNamespace: sagemaker ScalingPolicy: Type: "AWS::ApplicationAutoScaling::ScalingPolicy" Properties: PolicyName:my-scaling-policyPolicyType: TargetTrackingScaling ScalingTargetId: Ref: ScalingTarget TargetTrackingScalingPolicyConfiguration: TargetValue:70.0ScaleInCooldown:600ScaleOutCooldown:30PredefinedMetricSpecification: PredefinedMetricType: SageMakerVariantInvocationsPerInstance
Untuk informasi selengkapnya, lihat Membuat sumber daya Application Auto Scaling dengan AWS CloudFormation di Panduan Pengguna Application Auto Scaling.