Configuración de la inferencia para un modelo personalizado

Tras crear un modelo personalizado, puede configurar la inferencia mediante una de las siguientes opciones:

Adquirir rendimiento aprovisionado: compre rendimiento aprovisionado para su modelo para configurar una capacidad de computación dedicada con un rendimiento garantizado a fin de lograr un rendimiento uniforme y una latencia más baja.

Para obtener más información sobre el rendimiento aprovisionado, consulte Aumento de la capacidad de invocación de modelos con el rendimiento aprovisionado en Amazon Bedrock. Para obtener más información sobre el uso de modelos personalizados con rendimiento aprovisionado, consulte Adquisición de rendimiento aprovisionado para un modelo personalizado.
Implementar la inferencia bajo demanda para un modelo personalizado: para configurar la inferencia bajo demanda, el modelo se implementa con una implementación de modelo personalizado. Después de implementar el modelo, lo invoca mediante el ARN para la implementación del modelo personalizado. Con la inferencia bajo demanda, solo paga por lo que utiliza y no necesita configurar recursos de computación aprovisionados.

Para obtener más información sobre la implementación de modelos personalizados para la inferencia bajo demanda, consulte Implementar un modelo personalizado para inferencia bajo demanda.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Visualización de los detalles de un modelo personalizado

Adquisición de rendimiento aprovisionado para un modelo personalizado