

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Crear un trabajo de inferencia por lotes
<a name="batch-inference-create"></a>

Tras configurar un bucket de Amazon S3 con archivos para ejecutar la inferencia de modelos, puede crear un trabajo de inferencia por lotes. Antes de empezar, compruebe que ha configurado los archivos de acuerdo con las instrucciones descritas en [Formateo y carga de los datos de la inferencia por lotes](batch-inference-data.md).

**nota**  
Para enviar un trabajo de inferencia por lotes mediante una VPC, debe usar la API. Seleccione la pestaña API para obtener información sobre cómo incluir la configuración de la VPC.

Para obtener más información sobre cómo crear un trabajo de inferencia en lotes, seleccione la pestaña correspondiente al método que prefiera y siga los pasos:

------
#### [ Console ]

**Creación de un trabajo de inferencia por lotes**

1. Inicie sesión Consola de administración de AWS con una identidad de IAM que tenga permisos para usar la consola Amazon Bedrock. A continuación, abra la consola de Amazon Bedrock en [https://console.aws.amazon.com/bedrock.](https://console.aws.amazon.com/bedrock)

1. En el panel de navegación de la izquierda, seleccione **Inferencia por lotes**.

1. En la sección **Trabajos de inferencia por lotes**, elija **Crear trabajo.**

1. En la sección **Detalles del trabajo**, asigne un **Nombre del trabajo** al trabajo de inferencia por lotes y seleccione un modelo para usarlo en el trabajo de inferencia por lotes eligiendo **Seleccionar modelo**.

1. En la sección **Tipo de invocación del modelo**, elija el formato de API para los datos de entrada. Elige **InvokeModel**si los datos de entrada utilizan formatos de solicitud específicos del modelo o elige **Converse** si los datos de entrada utilizan el formato de la API de Converse. El valor predeterminado es **InvokeModel**.

1. En la sección **Datos de entrada**, elija **Examinar S3** y seleccione la ubicación de S3 para el trabajo de inferencia en lotes. La inferencia en lotes procesa todos los archivos JSONL y los archivos de contenido adjuntos en esa ubicación de S3, tanto si la ubicación es una carpeta de S3 como un solo archivo JSONL.
**nota**  
Si los datos de entrada están en un bucket de S3 que pertenece a una cuenta diferente de aquella desde la que envía el trabajo, debe usar la API para enviar el trabajo de inferencia por lotes. Para obtener información sobre cómo hacerlo, seleccione la pestaña API de arriba.

1. En la sección **Datos de salida**, elija **Examinar S3** y seleccione una ubicación de S3 para almacenar los archivos de salida de su trabajo de inferencia por lotes. De forma predeterminada, los datos de salida se cifrarán mediante un Clave administrada de AWS. Para elegir una clave de KMS personalizada, seleccione **Personalizar configuración de cifrado (avanzada)** y elija una clave. Para obtener más información sobre el cifrado de los recursos de Amazon Bedrock y la configuración de una clave de KMS personalizada, consulte [Cifrado de datos](data-encryption.md).
**nota**  
Si tiene previsto escribir los datos de salida en un bucket de S3 que pertenece a una cuenta diferente de aquella desde la que envía el trabajo, debe usar la API para enviar el trabajo de inferencia por lotes. Para obtener información sobre cómo hacerlo, seleccione la pestaña API de arriba.

1. En la sección **Acceso al servicio**, seleccione una de las siguientes opciones:
   + **Usar un rol de servicio existente**: seleccione un rol de servicio en la lista desplegable. Para obtener más información sobre cómo configurar un rol personalizado con los permisos adecuados, consulte [Permisos obligatorios para la inferencia por lotes](batch-inference-permissions.md).
   + **Crear y usar un nuevo rol de servicio**: introduzca un nombre para el rol de servicio.

1. (Opcional) Para asociar etiquetas al trabajo de inferencia por lotes, expanda la sección **Etiquetas** y añada una clave y un valor opcional para cada etiqueta. Para obtener más información, consulte [Etiquetado de los recursos de Amazon Bedrock](tagging.md).

1. Elija **Crear trabajo de inferencia por lotes**.

------
#### [ API ]

Para crear un trabajo de inferencia por lotes, envíe una [CreateModelInvocationJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_CreateModelInvocationJob.html)solicitud con un punto final del [plano de control de Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-cp).

Los siguientes campos son obligatorios:


****  

| Campo | Caso de uso | 
| --- | --- | 
| jobName | Para especificar un nombre para el trabajo. | 
| roleArn | Para especificar el Nombre de recurso de Amazon (ARN) del rol de servicio con permisos para crear y administrar el trabajo. Para obtener más información, consulte [Creación de un rol de servicio personalizado para la inferencia en lotes](batch-iam-sr.md). | 
| modelId | Para especificar el ID o el ARN del modelo que se va a utilizar en la inferencia. | 
| inputDataConfig | Especificar la ubicación de S3 que contiene los datos de entrada. La inferencia en lotes procesa todos los archivos JSONL y los archivos de contenido adjuntos en esa ubicación de S3, tanto si la ubicación es una carpeta de S3 como un solo archivo JSONL. Para obtener más información, consulte [Formateo y carga de los datos de la inferencia por lotes](batch-inference-data.md). | 
| outputDataConfig | Para especificar la ubicación de S3 en la que escribir las respuestas del modelo. | 

Los siguientes campos son opcionales:


****  

| Campo | Caso de uso | 
| --- | --- | 
| modelInvocationType | Para especificar el formato de API de los datos de entrada. ConverseConfigúrelo para usar el formato de la API de Converse o InvokeModel (predeterminado) para usar formatos de solicitud específicos del modelo. [Para obtener más información sobre el formato de solicitud de Converse, consulte Converse.](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html) | 
| timeoutDurationInHoras | Para especificar la duración en horas tras la cual se agotará el tiempo de espera del trabajo. | 
| etiquetas | Para especificar las etiquetas que desee asociar al trabajo. Para obtener más información, consulte [Etiquetado de los recursos de Amazon Bedrock](tagging.md). | 
| vpcConfig | Para especificar la configuración de VPC que se va a utilizar para proteger los datos durante el trabajo. Para obtener más información, consulte [Protección de los trabajos de inferencia de lotes mediante una VPC](batch-vpc.md). | 
| clientRequestToken | Para garantizar que la solicitud de la API se complete solo una vez. Para obtener más información, consulte [Ensuring idempotency](https://docs.aws.amazon.com/ec2/latest/devguide/ec2-api-idempotency.html). | 

La respuesta devuelve un `jobArn` que puede usar para hacer referencia al trabajo al realizar otras llamadas a la API relacionadas con la inferencia por lotes.

------