Adquisición de rendimiento aprovisionado para un modelo personalizado

Para usar un modelo personalizado con capacidad de procesamiento dedicada y rendimiento aprovisionado, puede adquirir rendimiento aprovisionado para él. A continuación, puede utilizar el modelo aprovisionado resultante como inferencia. Para obtener más información sobre el rendimiento aprovisionado, consulte Aumento de la capacidad de invocación de modelos con el rendimiento aprovisionado en Amazon Bedrock.

Console

Para adquirir un rendimiento aprovisionado para un modelo personalizado.

Inicie sesión Consola de administración de AWS con una identidad de IAM que tenga permisos para usar la consola Amazon Bedrock. A continuación, abra la consola de Amazon Bedrock en https://console.aws.amazon.com/bedrock.
En el panel de navegación de la izquierda, seleccione Modelos personalizados en Ajustar.
En la pestaña Modelos, pulse el botón de opción situado junto al modelo para el que desee comprar rendimiento aprovisionado o seleccione el nombre del modelo para ir a la página de detalles.
A continuación, seleccione Adquisición de rendimiento aprovisionado.
Para obtener más información, siga los pasos de la documentación sobre rendimiento aprovisionado.
Después de adquirir rendimiento aprovisionado para un modelo personalizado, siga los pasos de la documentación sobre el uso de rendimiento aprovisionado.

Cuando realice cualquier operación que permita usar modelos personalizados, verá su modelo personalizado como una opción en el menú de selección de modelos.

API

Para adquirir el rendimiento aprovisionado para un modelo personalizado, siga los pasos de la documentación sobre el rendimiento aprovisionado para enviar una solicitud CreateProvisionedModelThroughput(consulte el enlace para ver los formatos de solicitud y respuesta y los detalles de los campos) con un punto final del plano de control de Amazon Bedrock. Utilice el nombre o el ARN del modelo personalizado como modelId. La respuesta devuelve un valor provisionedModelArn que puede utilizar modelId al realizar una solicitud o solicitud. InvokeModel InvokeModelWithResponseStream

Ver ejemplos de código

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Configuración de la inferencia para un modelo personalizado

Implementar un modelo personalizado para inferencia bajo demanda