

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Invocación de un punto de conexión sin servidor
<a name="serverless-endpoints-invoke"></a>

Para realizar la inferencia utilizando un punto de conexión sin servidor, debe enviar una solicitud HTTP al punto de conexión. Puede usar la [InvokeEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_runtime_InvokeEndpoint.html)API o la AWS CLI, que realizan una `POST` solicitud para invocar su punto final. El tamaño máximo de carga útil de solicitud y respuesta para las invocaciones sin servidor es de 4 MB. Para puntos de conexión sin servidor:
+ El modelo debería descargarse y el servidor debería responder correctamente a `/ping` en un plazo de 3 minutos.
+ El tiempo de espera para que el contenedor responda a las solicitudes de inferencia de `/invocations` es de 1 minuto.

## Invocar un punto de conexión
<a name="serverless-endpoints-invoke-api"></a>

El siguiente ejemplo usa el [AWS SDK para Python (Boto3) para llamar](https://boto3.amazonaws.com/v1/documentation/api/latest/index.html) a la API. [InvokeEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_runtime_InvokeEndpoint.html) Ten en cuenta que, a diferencia de las demás llamadas a la API de esta guía`InvokeEndpoint`, for debes usar SageMaker Runtime Runtime como cliente. Especifique los siguientes valores:
+ En `endpoint_name`, utilice el nombre del punto de conexión sin servidor en servicio que quiera invocar.
+ En `content_type`, especifique el tipo MIME de sus datos de entrada en el cuerpo de la solicitud (por ejemplo, `application/json`).
+ En `payload`, utilice la carga útil de la solicitud como inferencia. Su carga útil debe estar en bytes o un objeto similar a un archivo.

```
runtime = boto3.client("sagemaker-runtime")

endpoint_name = "<your-endpoint-name>"
content_type = "<request-mime-type>"
payload = <your-request-body>

response = runtime.invoke_endpoint(
    EndpointName=endpoint_name,
    ContentType=content_type,
    Body=payload
)
```