Uso de un rendimiento aprovisionado con un recurso de Amazon Bedrock - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Uso de un rendimiento aprovisionado con un recurso de Amazon Bedrock

Después de adquirir un rendimiento aprovisionado, puede usarlo con las siguientes características para aumentar su rendimiento:

  • Inferencia del modelo: puede probar el rendimiento aprovisionado en un área de juego de la consola de Amazon Bedrock. Cuando lo tenga todo listo para implementar el rendimiento aprovisionado, configure su aplicación para invocar el modelo aprovisionado. Elige la pestaña del método que prefieras y, a continuación, sigue los pasos:

    Console
    Uso de un rendimiento aprovisionado en el área de juego de consolas de Amazon Bedrock
    1. Inicie sesión AWS Management Console con un director de IAM que tenga permisos para usar la consola Amazon Bedrock. A continuación, abra la consola Amazon Bedrock en https://console.aws.amazon.com/bedrock/.

    2. En el panel de navegación de la izquierda, seleccione Chat, Texto o Imagen en Áreas de juego, según su caso de uso específico.

    3. Elija Seleccionar el modelo.

    4. En la columna 1. Categoría, seleccione un proveedor o una categoría de modelo personalizado. A continuación, en la columna 2. Modelo, seleccione el modelo al que está asociado su rendimiento aprovisionado.

    5. En la columna 3. Rendimiento, seleccione el rendimiento aprovisionado.

    6. Seleccione Aplicar.

    Para aprender a utilizar las áreas de juego de Amazon Bedrock, consulte Generación de respuestas en la consola mediante áreas de juego.

    API

    Para ejecutar una inferencia mediante un rendimiento aprovisionado, envíe una solicitud InvokeModelInvokeModelWithResponseStream, una conversación o una solicitud ConverseStreamcon un punto de ejecución de Amazon Bedrock. Especifique el ARN del modelo aprovisionado como parámetro modelId. Para ver los requisitos del cuerpo de la solicitud para los distintos modelos, consulte Parámetros de solicitud de inferencia y campos de respuesta para los modelos fundacionales.

    Ver ejemplos de código

  • Asociar un rendimiento aprovisionado con un alias de agente: puede asociar un rendimiento aprovisionado al crear o actualizar un alias de agente. En la consola de Amazon Bedrock, puede elegir el rendimiento aprovisionado al configurar el alias o al editarlo. En la API de Amazon Bedrock, la provisionedThroughput especificas routingConfiguration cuando envías una solicitud CreateAgentAliaso UpdateAgentAlias;.