

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Créer une configuration de point de terminaison
<a name="serverless-endpoints-create-config"></a>

Après avoir créé un modèle, créez une configuration de point de terminaison. Vous pouvez ensuite déployer votre modèle à l’aide des spécifications de votre configuration de point de terminaison. Dans la configuration, vous spécifiez si vous souhaitez un point de terminaison en temps réel ou sans serveur. Pour créer une configuration de point de terminaison sans serveur, vous pouvez utiliser la [console Amazon SageMaker AI](https://console.aws.amazon.com/sagemaker/home), l'[CreateEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpointConfig.html)API ou le AWS CLI. Les approches relatives à l’API et à la console sont décrites dans les sections suivantes.

## Pour créer une configuration de point de terminaison (à l’aide de l’API)
<a name="serverless-endpoints-create-config-api"></a>

L'exemple suivant utilise le [AWS SDK pour Python (Boto3) pour appeler](https://boto3.amazonaws.com/v1/documentation/api/latest/index.html) l'API. [CreateEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpointConfig.html) Indiquez l’une des valeurs suivantes :
+ Pour `EndpointConfigName`, choisissez un nom pour la configuration du point de terminaison. Le nom doit être unique dans votre compte dans une région.
+ (Facultatif) Pour`KmsKeyId`, utilisez l'ID de clé, l'ARN de clé, le nom d'alias ou l'ARN d'alias de la AWS KMS clé que vous souhaitez utiliser. SageMaker L'IA utilise cette clé pour chiffrer votre image Amazon ECR.
+ Pour `ModelName`, utilisez le nom du modèle que vous souhaitez déployer. Il doit s’agir du même modèle que celui que vous avez utilisé dans l’étape [Création d’un modèle](serverless-endpoints-create-model.md).
+ Dans `ServerlessConfig` :
  + Définissez `MemorySizeInMB` sur `2048`. Pour cet exemple, nous définissons la taille de la mémoire sur 2 048 Mo, mais vous pouvez choisir l’une des valeurs suivantes pour votre taille de mémoire : 1 024 Mo, 2 048 Mo, 3 072 Mo, 4 096 Mo, 5 120 Mo ou 6 144 Mo. 
  + Définissez `MaxConcurrency` sur `20`. Pour cet exemple, nous définissons la concurrence maximale à 20. Le nombre maximal d’appels simultanés que vous pouvez définir pour un point de terminaison sans serveur est de 200 et la valeur minimale que vous pouvez choisir est 1.
  + (Facultatif) Pour utiliser la simultanéité provisionnée, définissez `ProvisionedConcurrency` sur 10. Pour cet exemple, nous définissons la simultanéité provisionnée sur 10. Le nombre de `ProvisionedConcurrency` d’un point de terminaison sans serveur doit être inférieur ou égal au nombre de `MaxConcurrency`. Vous pouvez le laisser vide si vous souhaitez utiliser un point de terminaison d’inférence sans serveur à la demande. Vous pouvez mettre à l’échelle la simultanéité provisionnée de façon dynamique. Pour de plus amples informations, veuillez consulter [Mise à l’échelle automatique de la simultanéité provisionnée pour un point de terminaison sans serveur](serverless-endpoints-autoscale.md).

```
response = client.create_endpoint_config(
   EndpointConfigName="{{<your-endpoint-configuration>}}",
   KmsKeyId="arn:aws:kms:us-east-1:123456789012:key/143ef68f-76fd-45e3-abba-ed28fc8d3d5e",
   ProductionVariants=[
        {
            "ModelName": "{{<your-model-name>}}",
            "VariantName": "AllTraffic",
            "ServerlessConfig": {
                "MemorySizeInMB": 2048,
                "MaxConcurrency": 20,
                "ProvisionedConcurrency": 10,
            }
        } 
    ]
)
```

## Pour créer une configuration de point de terminaison (à l’aide de la console)
<a name="serverless-endpoints-create-config-console"></a>

1. Connectez-vous à la [console Amazon SageMaker AI](https://console.aws.amazon.com/sagemaker/home).

1. Sous l'onglet de navigation, sélectionnez **Inference**.

1. Ensuite, sélectionnez **Configurations de point de terminaison**.

1. Sélectionnez **Créer une configuration de point de terminaison**.

1. Pour **Nom de configuration du point de terminaison**, saisissez un nom unique au sein de votre compte d’une région.

1. Pour **Type de point de terminaison**, sélectionnez **Sans serveur**.  
![Capture d’écran de l’option de type de point de terminaison dans la console.](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/serverless-endpoints-endpoint-config.png)

1. Pour **Variantes de production**, sélectionnez **Ajouter un modèle**.

1. Sous **Ajouter un modèle**, sélectionnez le modèle que vous souhaitez utiliser dans la liste des modèles, puis sélectionnez **Enregistrer**.

1. Après avoir ajouté votre modèle, sous **Actions**, sélectionnez **Modifier**.

1. Pour **Taille de la mémoire**, choisissez la taille de mémoire souhaitée en Go.  
![Capture d’écran de l’option de taille de mémoire dans la console.](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/serverless-endpoints-endpoint-config-2.png)

1. Pour **Simultanéité max.**, saisissez le nombre maximal d’appels simultanés souhaité pour le point de terminaison. La valeur maximale que vous pouvez saisir est 200 et la valeur minimale est 1.

1. (Facultatif) Pour utiliser la simultanéité provisionnée, entrez le nombre souhaité d’invocations simultanées dans le champ **Paramètres de la simultanéité provisionnée**. Le nombre d’invocations simultanées provisionnées doit être inférieur ou égal au nombre d’invocations simultanées maximum.

1. Choisissez **Enregistrer**.

1. (Facultatif) Pour **Balises**, saisissez des paires de valeur clé si vous souhaitez créer des métadonnées pour votre configuration de point de terminaison.

1. Sélectionnez **Créer une configuration de point de terminaison**.