

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Creare una configurazione endpoint
<a name="serverless-endpoints-create-config"></a>

Dopo aver creato un modello, creare una configurazione endpoint. È quindi possibile distribuire il modello utilizzando le specifiche nella configurazione endpoint. Nella configurazione, si specifica se si desidera un endpoint in tempo reale o serverless. Per creare una configurazione endpoint serverless, puoi utilizzare la [console Amazon SageMaker AI](https://console.aws.amazon.com/sagemaker/home), l'[CreateEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpointConfig.html)API o il. AWS CLI Gli approcci all'API e alla console sono descritti nelle seguenti sezioni.

## Per creare una configurazione endpoint (mediante l’API)
<a name="serverless-endpoints-create-config-api"></a>

L'esempio seguente utilizza l'[AWS SDK for Python (Boto3) per chiamare l'](https://boto3.amazonaws.com/v1/documentation/api/latest/index.html)API. [CreateEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpointConfig.html) Specifica i seguenti valori:
+ Per `EndpointConfigName`, scegliere un nome per la configurazione endpoint. Il nome deve essere univoco all'interno dell’account in una Regione.
+ (Facoltativo) Per`KmsKeyId`, usa l'ID chiave, l'ARN della chiave, il nome alias o l'alias ARN per qualsiasi AWS KMS chiave che desideri utilizzare. SageMaker L'intelligenza artificiale utilizza questa chiave per crittografare la tua immagine Amazon ECR.
+ Per `ModelName`, usare il nome del modello da distribuire. Dovrebbe essere lo stesso modello usato nella fase [Creazione di un modello](serverless-endpoints-create-model.md).
+ Per `ServerlessConfig`:
  + Imposta `MemorySizeInMB` su `2048`. Per questo esempio, abbiamo impostato le dimensioni della memoria su 2048 MB, ma è possibile scegliere uno dei valori seguenti: 1024 MB, 2048 MB, 3072 MB, 4096 MB, 5120 MB o 6144 MB. 
  + Imposta `MaxConcurrency` su `20`. Per questo esempio, impostiamo il numero massimo di simultaneità su 20. Il numero massimo di richiami simultanei che è possibile impostare per un endpoint serverless è 200, mentre il valore minimo che è possibile scegliere è 1.
  + (Facoltativo) Per utilizzare Concorrenza assegnata, impostare `ProvisionedConcurrency` su 10. Per questo esempio, impostiamo Concorrenza assegnata su 10. Il numero `ProvisionedConcurrency` per un endpoint serverless deve essere inferiore o uguale al numero `MaxConcurrency`. È possibile lasciarlo vuoto se si desidera utilizzare l'endpoint Serverless Inference su richiesta. È possibile scalare dinamicamente Effettua il provisioning di simultaneità. Per ulteriori informazioni, consulta [Dimensionamento automatico del provisioning simultaneo per un endpoint serverless](serverless-endpoints-autoscale.md).

```
response = client.create_endpoint_config(
   EndpointConfigName="<your-endpoint-configuration>",
   KmsKeyId="arn:aws:kms:us-east-1:123456789012:key/143ef68f-76fd-45e3-abba-ed28fc8d3d5e",
   ProductionVariants=[
        {
            "ModelName": "<your-model-name>",
            "VariantName": "AllTraffic",
            "ServerlessConfig": {
                "MemorySizeInMB": 2048,
                "MaxConcurrency": 20,
                "ProvisionedConcurrency": 10,
            }
        } 
    ]
)
```

## Per creare una configurazione endpoint (mediante la console)
<a name="serverless-endpoints-create-config-console"></a>

1. Accedi alla [console Amazon SageMaker AI](https://console.aws.amazon.com/sagemaker/home).

1. Nella scheda di navigazione, scegliere **Inferenza**.

1. Quindi, scegliere **Configurazioni endpoint**.

1. Scegliere **Crea configurazione endpoint**.

1. Per **Nome configurazione endpoint**, inserire un nome univoco all'interno dell'account in una Regione.

1. Per **Tipo di endpoint**, selezionare **Serverless**.  
![\[Screenshot dell'opzione relativa al tipo di endpoint nella console.\]](http://docs.aws.amazon.com/it_it/sagemaker/latest/dg/images/serverless-endpoints-endpoint-config.png)

1. Per le **varianti di produzione**, scegliere **Aggiungi modello**.

1. In **Aggiungi modello**, selezionare il modello da utilizzare dall'elenco dei modelli, quindi scegliere **Salva**.

1. Dopo aver aggiunto il modello, in **Azioni**, scegliere **Modifica**.

1. Per **Dimensioni memoria**, scegliere le dimensioni della memoria desiderate in GB.  
![\[Screenshot dell'opzione relativa alle dimensioni della memoria nella console.\]](http://docs.aws.amazon.com/it_it/sagemaker/latest/dg/images/serverless-endpoints-endpoint-config-2.png)

1. Per **Max simultaneità**, inserire il numero massimo di invocazioni simultanee desiderato per l'endpoint. Il valore massimo inseribile è 200, mentre quello minimo è 1.

1. (Facoltativo) Per utilizzare Simultaneità assegnata, inserire il numero desiderato di chiamate simultanee nel campo dell’impostazione **Simultaneità assegnata**. Il numero di richiami simultanei assegnati deve essere minore o uguale al numero massimo di richiami simultanei.

1. Selezionare **Salva**.

1. (Facoltativo) Per **Tag**, immettere le coppie chiave-valore se si desidera creare metadati per la configurazione endpoint.

1. Scegliere **Crea configurazione endpoint**.