Configurar la inferencia para un modelo personalizado - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Configurar la inferencia para un modelo personalizado

Tras crear un modelo personalizado, puede configurar la inferencia mediante una de las siguientes opciones:

  • Adquiera el rendimiento aprovisionado: compre el rendimiento aprovisionado para su modelo a fin de configurar una capacidad de cómputo dedicada con un rendimiento garantizado a fin de lograr un rendimiento uniforme y una latencia más baja.

    Para obtener más información sobre el rendimiento aprovisionado, consulte Aumento de la capacidad de invocación de modelos con el rendimiento aprovisionado en Amazon Bedrock. Para obtener más información sobre el uso de modelos personalizados con el rendimiento aprovisionado, consulte. Adquisición de rendimiento aprovisionado para un modelo personalizado

  • Implemente un modelo personalizado para la inferencia bajo demanda (solo Amazon Nova modelos): para configurar la inferencia bajo demanda, implemente el modelo con un despliegue de modelo personalizado. Después de implementar el modelo, lo invoca mediante el ARN para la implementación del modelo personalizado. Con la inferencia bajo demanda, solo paga por lo que usa y no necesita configurar los recursos informáticos aprovisionados.

    Para obtener más información sobre la implementación de modelos personalizados para la inferencia bajo demanda, consulte. Implemente un modelo personalizado para la inferencia bajo demanda