Métricas en tiempo de ejecución de Amazon Bedrock Modele las métricas de registro de invocaciones CloudWatch

Supervise la `inferencia en tiempo de ejecución` fundamental mediante métricas CloudWatch

El bedrock-runtime.region.amazonaws.com punto de conexión de Amazon Bedrock publica las métricas en Amazon CloudWatch en el AWS/Bedrock espacio de nombres. Usa estas métricas para monitorear el volumen de invocaciones, la latencia, el consumo de tokens, las tasas de error y modelar la entrega de los registros de invocación.

Si su aplicación realiza una inferenciabedrock-mantle.region.api.aws, consulte en su lugar. Supervise la inferencia del manto rocoso mediante métricas CloudWatch

Métricas en tiempo de ejecución de Amazon Bedrock

En la siguiente tabla, se describen las métricas del tiempo de ejecución que proporciona Amazon Bedrock.

Nombre de métrica	Unidad	Description (Descripción)
Invocations	SampleCount	Número de solicitudes realizadas correctamente a las operaciones de Converse ConverseStream InvokeModel, y InvokeModelWithResponseStreamAPI.
InvocationLatency	MilliSeconds	El tiempo transcurrido desde que se envía una solicitud hasta que se recibe el último token. Para distinguir los aumentos de latencia causados por los cambios en el rendimiento del lado del servicio de los aumentos causados por respuestas más largas del modelo, consulte. Diagnostique los InvocationLatencyaumentos mediante tokens de salida por segundo (OTPS)
InvocationClientErrors	SampleCount	Número de invocaciones que dan lugar a errores del lado del cliente.
InvocationServerErrors	SampleCount	Número de invocaciones que provocan errores en el servidor. AWS
InvocationThrottles	SampleCount	Número de invocaciones que el sistema ha limitado. Las solicitudes limitadas y otros errores de invocación no se contabilizan como invocaciones ni como errores. El número de limitaciones que vea dependerá de la configuración de reintentos del SDK. Para obtener más información, consulta el comportamiento de los reintentos en la Guía de referencia de los AWS SDK y las herramientas.
InputTokenCount	SampleCount	Número de tokens de la entrada.
LegacyModelInvocations	SampleCount	Número de invocaciones que utilizan modelos Heredados
OutputTokenCount	SampleCount	Número de tokens de la salida.
OutputImageCount	SampleCount	Número de imágenes en la salida (solo aplicable a los modelos de generación de imágenes).
TimeToFirstToken	MilliSeconds	El tiempo transcurrido desde que se envía una solicitud hasta que se recibe el primer token, tanto para las operaciones de la API como para ConverseStreamlas de InvokeModelWithResponseStreamstreaming.
EstimatedTPMQuotaUsage	SampleCount	Consumo estimado de cuotas de tokens por minuto (TPM) en las operaciones de Converse y InvokeModelWithResponseStreamAPI. ConverseStream InvokeModel Esta métrica es una aproximación y no refleja el consumo de fichas basado en las reservas que impulsa las decisiones restrictivas. La limitación se basa en la reserva inicial de los tokens de entrada más `max_tokens` (consulteContabilización de los tokens en Amazon Bedrock), lo que puede diferir de esta estimación. No utilices esta métrica como único indicador para el uso de las cuotas o la planificación de la capacidad.
CacheReadInputTokens	SampleCount	Número de símbolos de entrada leídos de la caché de solicitudes. Estos tokens se cobran a una tarifa reducida y no se tienen en cuenta para tu cuota de TPM.
CacheWriteInputTokens	SampleCount	Número de símbolos de entrada escritos en la caché de solicitudes. Estos tokens se tienen en cuenta para tu cuota de TPM.

También hay métricas para Barreras de protección para Amazon Bedrock y Agentes para Amazon Bedrock.

Modele las métricas de registro de invocaciones CloudWatch

Para cada intento de entrega exitoso o fallido, se emiten las siguientes CloudWatch métricas de Amazon en el espacio de nombres y Across all model IDs la AWS/Bedrock dimensión:

ModelInvocationLogsCloudWatchDeliverySuccess
ModelInvocationLogsCloudWatchDeliveryFailure
ModelInvocationLogsS3DeliverySuccess
ModelInvocationLogsS3DeliveryFailure
ModelInvocationLargeDataS3DeliverySuccess
ModelInvocationLargeDataS3DeliveryFailure

Para obtener métricas de las operaciones de Amazon Bedrock, especifique la siguiente información:

La dimensión de la métrica. Una dimensión es un conjunto de pares nombre-valor que se emplea para identificar una métrica. Amazon Bedrock es compatible con las siguientes dimensiones:
- ModelId: todas las métricas
- ModelId + ImageSize + BucketedStepSize – OutputImageCount
El nombre de la métrica, como InvocationClientErrors.

Puede obtener métricas de Amazon Bedrock con la Consola de administración de AWS AWS CLI, la o la CloudWatch API. Puede utilizar la CloudWatch API a través de uno de los kits de desarrollo de AWS software (SDK) o las herramientas de la CloudWatch API.

Para ver las métricas de Amazon Bedrock en la CloudWatch consola, vaya a la sección de métricas del panel de navegación, seleccione la opción todas las métricas y, a continuación, busque el ID del modelo.

Debe tener los CloudWatch permisos adecuados para monitorear Amazon Bedrock. CloudWatch Para obtener más información, consulte Autenticación y control de acceso para Amazon CloudWatch en la Guía del CloudWatch usuario de Amazon.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Supervise los modelos

Supervise el OTPS

Supervise la inferencia en tiempo de ejecución fundamental mediante métricas CloudWatch

Métricas en tiempo de ejecución de Amazon Bedrock

Modele las métricas de registro de invocaciones CloudWatch

Supervise la `inferencia en tiempo de ejecución` fundamental mediante métricas CloudWatch