

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Creación de una configuración de punto de conexión
<a name="serverless-endpoints-create-config"></a>

Una vez creado el modelo, cree una configuración de punto de conexión. A continuación, puede implementar el modelo utilizando las especificaciones de la configuración de su punto de conexión. En la configuración, especifique si desea un punto de conexión en tiempo real o sin servidor. Para crear una configuración de punto final sin servidor, puede utilizar la [consola Amazon SageMaker AI](https://console.aws.amazon.com/sagemaker/home), la [CreateEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpointConfig.html)API o la AWS CLI. Los enfoques de la API y la consola se describen en las siguientes secciones.

## Crear una configuración de punto de conexión (usando API)
<a name="serverless-endpoints-create-config-api"></a>

El siguiente ejemplo usa el [AWS SDK para Python (Boto3) para llamar](https://boto3.amazonaws.com/v1/documentation/api/latest/index.html) a la API. [CreateEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpointConfig.html) Especifique los siguientes valores:
+ En `EndpointConfigName`, seleccione un nombre para la configuración del punto de conexión. El nombre debe ser único dentro de su cuenta en una Región.
+ (Opcional) Para`KmsKeyId`, utilice el ID de clave, el ARN de clave, el nombre del alias o el ARN del alias para la AWS KMS clave que desee utilizar. SageMaker La IA utiliza esta clave para cifrar la imagen de Amazon ECR.
+ En `ModelName`, utilice el nombre del modelo que quiera implementar. Debe ser el mismo modelo que haya utilizado en el paso [Crear un modelo](serverless-endpoints-create-model.md).
+ En `ServerlessConfig`:
  + Establece `MemorySizeInMB` en `2048`. En este ejemplo, hemos establecido el tamaño de la memoria en 2048 MB, pero puede elegir cualquiera de los siguientes valores para el tamaño de la memoria: 1024 MB, 2048 MB, 3072 MB, 4096 MB, 5120 MB o 6144 MB. 
  + Establece `MaxConcurrency` en `20`. Para este ejemplo, estableceremos la simultaneidad máxima en 20. El número máximo de invocaciones simultáneas que puede establecer para un punto de conexión sin servidor es 200 y el valor mínimo que puede elegir es 1.
  + (Opcional) Para usar la simultaneidad aprovisionada, establezca `ProvisionedConcurrency` en 10. Para este ejemplo, estableceremos la simultaneidad aprovisionada en 10. El número `ProvisionedConcurrency` de un punto de conexión sin servidor debe ser inferior o igual al número `MaxConcurrency`. Puede dejarlo vacío si quiere utilizar un punto de conexión de inferencia sin servidor bajo demanda. Puede escalar de forma dinámica la simultaneidad de aprovisionamiento. Para obtener más información, consulte [Escalar automáticamente la simultaneidad aprovisionada para un punto de conexión sin servidor](serverless-endpoints-autoscale.md).

```
response = client.create_endpoint_config(
   EndpointConfigName="{{<your-endpoint-configuration>}}",
   KmsKeyId="arn:aws:kms:us-east-1:123456789012:key/143ef68f-76fd-45e3-abba-ed28fc8d3d5e",
   ProductionVariants=[
        {
            "ModelName": "{{<your-model-name>}}",
            "VariantName": "AllTraffic",
            "ServerlessConfig": {
                "MemorySizeInMB": 2048,
                "MaxConcurrency": 20,
                "ProvisionedConcurrency": 10,
            }
        } 
    ]
)
```

## Crear una configuración de punto de conexión (usando la consola)
<a name="serverless-endpoints-create-config-console"></a>

1. Inicia sesión en la [consola de Amazon SageMaker AI](https://console.aws.amazon.com/sagemaker/home).

1. En la pestaña de navegación, seleccione **Inferencia**.

1. A continuación, seleccione las **configuraciones de punto de conexión**.

1. Seleccione **Crear configuración de punto de conexión**.

1. En el **nombre de la configuración del punto de conexión**, introduzca un nombre único dentro de su cuenta en una región.

1. En **Tipo de punto de conexión**, seleccione **Sin rervidor**.  
![Captura de pantalla de la opción del tipo de punto de conexión en la consola.](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/images/serverless-endpoints-endpoint-config.png)

1. En las **variantes de producción**, seleccione **Añadir modelo**.

1. En **Añadir modelo**, seleccione el modelo que quiera usar de la lista de modelos y, a continuación, seleccione **Guardar**.

1. Tras añadir el modelo, en **Acciones**, seleccione **Editar**.

1. En **Tamaño de memoria**, seleccione el tamaño de memoria que quiera en GB.  
![Captura de pantalla de la opción de tamaño de memoria en la consola.](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/images/serverless-endpoints-endpoint-config-2.png)

1. En **Simultaneidad máxima**, introduzca el número máximo de invocaciones simultáneas que quiera para el punto de conexión. El valor máximo que puede introducir es 200 y el mínimo es 1.

1. (Opcional) Para usar la simultaneidad aprovisionada, introduzca el número deseado de invocaciones simultáneas en el campo de **configuración de simultaneidad aprovisionada**. El número de invocaciones simultáneas aprovisionadas debe ser menor o igual que el número máximo de invocaciones simultáneas.

1. Seleccione **Guardar**.

1. (Opcional) En **Etiquetas**, introduzca pares clave-valor si quiere crear metadatos para la configuración de punto de conexión.

1. Seleccione **Crear configuración de punto de conexión**.