

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Prerequisiti per il dimensionamento automatico
<a name="endpoint-auto-scaling-prerequisites"></a>

Prima di poter utilizzare la scalabilità automatica, devi aver già creato un endpoint modello Amazon SageMaker AI. È possibile avere più versioni del modello per lo stesso endpoint. Ogni modello viene definito [variante (modello) di produzione](model-ab-testing.md). Per maggiori informazioni sulla distribuzione di un endpoint di un modello, consulta [Implementa il modello su AI Hosting Services SageMaker](ex1-model-deployment.md#ex1-deploy-model).

Per attivare la scalabilità automatica per un modello, puoi utilizzare la console SageMaker AI, AWS Command Line Interface (AWS CLI) o un AWS SDK tramite l'API Application Auto Scaling. 
+ Se è la prima volta che configuri il dimensionamento per un modello, è consigliabile [Configurazione del modello di scalabilità automatica con la console](endpoint-auto-scaling-add-console.md). 
+ Quando si utilizza AWS CLI o l'API Application Auto Scaling, il flusso consiste nel registrare il modello come destinazione scalabile, definire la politica di scalabilità e quindi applicarla. **Sulla console SageMaker AI, in **Inference** nel riquadro di navigazione, scegli Endpoints.** Trova il nome dell’endpoint del modello, quindi sceglilo per trovare il nome della variante. È necessario specificare sia il nome dell’endpoint che il nome della variante per attivare il dimensionamento automatico per un modello.

L'auto scaling è reso possibile da una combinazione di Amazon SageMaker AI CloudWatch, Amazon e Application Auto APIs Scaling. Per informazioni sulle autorizzazioni minime richieste, consulta [Esempi di policy basate su identità di Application Auto Scaling](https://docs.aws.amazon.com/autoscaling/application/userguide/security_iam_id-based-policy-examples.html) nella *Guida per l’utente di Application Auto Scaling*.

La policy IAM `SagemakerFullAccessPolicy` dispone di tutte le autorizzazioni IAM necessarie per eseguire il dimensionamento automatico. Per ulteriori informazioni sulle autorizzazioni SageMaker AI IAM, consulta. [Come utilizzare i ruoli di esecuzione dell' SageMaker IA](sagemaker-roles.md)

Se gestisci una policy di autorizzazioni personalizzata, devi includere le autorizzazioni seguenti:

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "sagemaker:DescribeEndpoint",
        "sagemaker:DescribeEndpointConfig",
        "sagemaker:UpdateEndpointWeightsAndCapacities"
      ],
      "Resource": "*"
    },
    {    
        "Effect": "Allow",
        "Action": [
            "application-autoscaling:*"
        ],
        "Resource": "*"
    },
    {
      "Effect": "Allow",
      "Action": "iam:CreateServiceLinkedRole",
      "Resource": "arn:aws:iam::*:role/aws-service-role/sagemaker.application-autoscaling.amazonaws.com/AWSServiceRoleForApplicationAutoScaling_SageMakerEndpoint",
      "Condition": {
        "StringLike": { "iam:AWSServiceName": "sagemaker.application-autoscaling.amazonaws.com"	}
      }
    },
    {
      "Effect": "Allow",
      "Action": [
        "cloudwatch:PutMetricAlarm",
        "cloudwatch:DescribeAlarms",
        "cloudwatch:DeleteAlarms"
      ],
      "Resource": "*"
    }
  ]
}
```

------

## Ruolo collegato al servizio
<a name="endpoint-auto-scaling-slr"></a>

Il dimensionamento automatico utilizza il ruolo collegato al servizio `AWSServiceRoleForApplicationAutoScaling_SageMakerEndpoint`. Il ruolo collegato al servizio concede ad Application Auto Scaling l’autorizzazione per descrivere gli allarmi per le policy, per monitorare i livelli di capacità attuale e per scalare la risorsa di destinazione. Questo ruolo viene creato automaticamente. Affinché la creazione automatica di un ruolo abbia esito positivo, è necessario disporre dell’autorizzazione per l’azione `iam:CreateServiceLinkedRole`. Per ulteriori informazioni, consulta [Ruoli collegati ai servizi](https://docs.aws.amazon.com/autoscaling/application/userguide/application-auto-scaling-service-linked-roles.html) nella *Guida per l'utente di Application Auto Scaling*.