CloudFormation을 사용하여 크기 조정 정책 생성 - Amazon SageMaker AI

CloudFormation을 사용하여 크기 조정 정책 생성

다음 예제는 CloudFormation을 사용하여 엔드포인트에 모델 오토 스케일을 구성을 생성하는 방법을 보여줍니다.

Endpoint: Type: "AWS::SageMaker::Endpoint" Properties: EndpointName: yourEndpointName EndpointConfigName: yourEndpointConfigName ScalingTarget: Type: "AWS::ApplicationAutoScaling::ScalableTarget" Properties: MaxCapacity: 10 MinCapacity: 2 ResourceId: endpoint/my-endpoint/variant/my-variant RoleARN: arn ScalableDimension: sagemaker:variant:DesiredInstanceCount ServiceNamespace: sagemaker ScalingPolicy: Type: "AWS::ApplicationAutoScaling::ScalingPolicy" Properties: PolicyName: my-scaling-policy PolicyType: TargetTrackingScaling ScalingTargetId: Ref: ScalingTarget TargetTrackingScalingPolicyConfiguration: TargetValue: 70.0 ScaleInCooldown: 600 ScaleOutCooldown: 30 PredefinedMetricSpecification: PredefinedMetricType: SageMakerVariantInvocationsPerInstance

자세한 내용을 알아보려면 Application Auto Scaling 사용 설명서에서 AWS CloudFormation으로 Application Auto Scaling 리소스 생성하기를 참조하세요.