Adquisición de un rendimiento aprovisionado para un modelo de Amazon Bedrock - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Adquisición de un rendimiento aprovisionado para un modelo de Amazon Bedrock

Amazon Bedrock ofrece dos tipos de rendimiento aprovisionado: por tokens y por unidades modelo. Consulte las siguientes instrucciones para conocer el tipo de rendimiento aprovisionado que desee adquirir.

Para obtener más información sobre las diferencias entre los dos tipos de rendimiento aprovisionado, consulte. Aumento de la capacidad de invocación de modelos con el rendimiento aprovisionado en Amazon Bedrock

Al adquirir un rendimiento aprovisionado por unidades de modelo para un modelo, se especifica el nivel de compromiso y el número de unidades de modelo () MUs que se van a asignar. Para ver las cuotas de las UM, consulte Amazon Bedrock endpoints and quotas en la Referencia general de AWS. Antes de poder comprar un rendimiento aprovisionado (con compromiso o sin compromiso), primero debe visitar el centro de AWS soporte MUs para solicitar que su cuenta se distribuya entre los rendimientos aprovisionados. Una vez que se haya concedido su solicitud, podrá comprar un rendimiento aprovisionado.

nota

Después de comprar el rendimiento aprovisionado, si está asociado a un modelo personalizado, puede cambiarlo especificando una de las siguientes opciones:

  • El modelo base a partir del cual se personalizó el modelo personalizado

  • Otro modelo personalizado que se personalizó a partir del mismo modelo base que el modelo personalizado

Solo puede cambiar el modelo asociado para los rendimientos aprovisionados asociados a un modelo personalizado.

Para obtener información sobre cómo comprar el rendimiento aprovisionado para un modelo, elija la pestaña correspondiente al método que prefiera y, a continuación, siga estos pasos:

Console
  1. Inicie sesión Consola de administración de AWS con una identidad de IAM que tenga permisos para usar la consola Amazon Bedrock. A continuación, abra la consola de Amazon Bedrock en https://console.aws.amazon.com/bedrock.

  2. En el panel de navegación de la izquierda, elija Rendimiento aprovisionado.

  3. En la sección Rendimiento aprovisionado, seleccione Adquisición de rendimiento aprovisionado.

  4. Para ver la sección Detalles del rendimiento aprovisionado, haga lo siguiente:

    1. En el campo Nombre del rendimiento aprovisionado, escriba un nombre para el rendimiento aprovisionado.

    2. En Seleccionar el modelo, seleccione un proveedor de modelos base o una categoría de modelos personalizados. A continuación, seleccione el modelo para el que desee aprovisionar el rendimiento.

      nota

      Para ver los modelos básicos para los que puede adquirir Provisioned Throughput sin compromiso, consulte la documentación de los modelos compatibles.

      En la AWS GovCloud (US) región, solo puede adquirir el rendimiento aprovisionado para modelos personalizados sin compromiso.

    3. (Opcional) Para asociar etiquetas al rendimiento aprovisionado, amplíe la sección Etiquetas y elija Agregar nueva etiqueta. Para obtener más información, consulte Etiquetado de los recursos de Amazon Bedrock.

  5. Para el modo de aprovisionamiento, seleccione Por unidades de modelo

  6. Para la sección Plazo de compromiso y unidades modelo, haga lo siguiente:

    1. En la sección Seleccione el plazo de compromiso, elija la cantidad de tiempo durante el que quiere comprometerse a utilizar el rendimiento aprovisionado.

    2. En el campo Unidades modelo, introduzca el número deseado de unidades modelo (MUs). Si va a aprovisionar un modelo con compromiso, primero debe visitar el centro de AWS soporte para solicitar un aumento en el número de modelos MUs que puede adquirir.

  7. Elija Comprar rendimiento aprovisionado.

  8. Revise la nota que aparece y confirme la duración y el precio del compromiso marcando la casilla de verificación. A continuación, seleccione Confirmar compra.

  9. La consola muestra la página de información general de Rendimiento aprovisionado. El Estado del rendimiento aprovisionado en la tabla Rendimiento aprovisionado pasa a Creando. Cuando se termine de crear el rendimiento aprovisionado, el Estado pasará a ser En servicio. Si la actualización falla, el Estado pasa a ser Error.

API

Para adquirir un rendimiento aprovisionado, envíe una CreateProvisionedModelThroughputsolicitud con un punto final del plano de control de Amazon Bedrock.

Para obtener más información sobre el contenido del cuerpo de la solicitud y los parámetros que debe proporcionar para crear un rendimiento aprovisionado por unidades modelo, consulte la referencia de la CreateProvisionedModelThroughputAPI de Amazon Bedrock.

nota

Para ver los modelos básicos para los que puede adquirir Provisioned Throughput sin compromiso, consulte la documentación sobre los modelos compatibles.

En la AWS GovCloud (US) región, solo puede adquirir el rendimiento aprovisionado para modelos personalizados sin compromiso.

La respuesta devuelve un valor provisionedModelArn que puede utilizar como modelId en la inferencia del modelo. Para comprobar si el rendimiento aprovisionado está listo para su uso, envíe una GetProvisionedModelThroughputsolicitud y compruebe que se encuentra en ese estado. InService Si se produce un error en la actualización, su estado será Failed y la GetProvisionedModelThroughputrespuesta contendrá un. failureMessage

Ver ejemplos de código