

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Pantau `inferensi batuan dasar runtime menggunakan metrik` CloudWatch
<a name="monitoring-runtime-metrics"></a>

`bedrock-runtime.{{region}}.amazonaws.com`Titik akhir Amazon Bedrock menerbitkan metrik ke CloudWatch Amazon di bawah namespace. `AWS/Bedrock` Gunakan metrik ini untuk memantau volume pemanggilan, latensi, konsumsi token, tingkat kesalahan, dan pengiriman pencatatan pemanggilan model.

Jika aplikasi Anda memanggil inferensi`bedrock-mantle.{{region}}.api.aws`, lihat [Pantau `inferensi mantel dasar menggunakan metrik` CloudWatch](monitoring-mantle-metrics.md) sebagai gantinya.

## Metrik runtime Amazon Bedrock
<a name="runtime-cloudwatch-metrics"></a>

Tabel berikut menjelaskan metrik runtime yang disediakan oleh Amazon Bedrock.


| Nama metrik | Unit | Deskripsi | 
| --- | --- | --- | 
| Invokasi | SampleCount | Jumlah permintaan yang berhasil untuk operasi [Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html), [ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html), [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html), dan [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)API. | 
| InvocationLatency | MilliSeconds | Waktu dari saat permintaan dikirim ke saat token terakhir diterima.<br />Untuk membedakan peningkatan latensi yang disebabkan oleh perubahan throughput sisi layanan dari peningkatan yang disebabkan oleh respons model yang lebih lama, lihat. [Mendiagnosis `InvocationLatency`peningkatan menggunakan token keluaran per detik (OTPS)](monitoring-runtime-otps.md) | 
| InvocationClientErrors | SampleCount | Jumlah pemanggilan yang menghasilkan kesalahan sisi klien. | 
| InvocationServerErrors | SampleCount | Jumlah pemanggilan yang menghasilkan kesalahan sisi AWS server. | 
| InvocationThrottles | SampleCount | Jumlah pemanggilan yang dibatasi oleh sistem. Permintaan yang dibatasi dan kesalahan pemanggilan lainnya tidak dihitung sebagai Pemanggilan atau Kesalahan. Jumlah throttle yang Anda lihat akan tergantung pada pengaturan coba ulang Anda di SDK. Untuk informasi selengkapnya, lihat [Mencoba lagi perilaku](https://docs.aws.amazon.com/sdkref/latest/guide/feature-retry-behavior.html) di AWS SDK dan Panduan Referensi Alat.  | 
| InputTokenCount | SampleCount | Jumlah token dalam input. | 
| LegacyModelInvocations | SampleCount | [Jumlah pemanggilan menggunakan model Legacy](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_FoundationModelLifecycle.html)  | 
| OutputTokenCount | SampleCount | Jumlah token dalam output. | 
| OutputImageCount | SampleCount | Jumlah gambar dalam output (hanya berlaku untuk model pembuatan gambar). | 
| TimeToFirstToken | MilliSeconds | Waktu dari saat permintaan dikirim ke saat token pertama diterima, untuk operasi API [ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html)dan [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)streaming. | 
| EstimatedTPMQuotaUsage | SampleCount | Estimasi konsumsi kuota Token Per Menit (TPM) di seluruh operasi [Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html),, [ConverseStream[InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html)](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html), dan [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)API. Metrik ini adalah perkiraan dan tidak mencerminkan konsumsi token berbasis reservasi yang mendorong keputusan pelambatan. Throttling didasarkan pada reservasi awal token input plus `max_tokens` (lihat[Bagaimana token dihitung di Amazon Bedrock](quotas-token-burndown.md)), yang mungkin berbeda dari perkiraan ini. Jangan gunakan metrik ini sebagai satu-satunya indikator untuk penggunaan kuota atau perencanaan kapasitas. | 
| CacheReadInputTokens | SampleCount | Jumlah token masukan yang dibaca dari [cache prompt](prompt-caching.md). Token ini dibebankan pada tingkat yang lebih rendah dan tidak dihitung terhadap kuota TPM Anda. | 
| CacheWriteInputTokens | SampleCount | Jumlah token masukan yang ditulis ke [cache prompt](prompt-caching.md). Token ini dihitung dalam kuota TPM Anda. | 

Ada juga metrik untuk [Amazon Bedrock Guardrails dan [Amazon](monitoring-agents-cw-metrics.md) Bedrock](monitoring-guardrails-cw-metrics.md) Agents.

## Metrik pencatatan pemanggilan model CloudWatch
<a name="br-cloudwatch-metrics"></a>

Untuk setiap upaya keberhasilan atau kegagalan pengiriman, CloudWatch metrik Amazon berikut akan dipancarkan di bawah namespace`AWS/Bedrock`, dan dimensi: `Across all model IDs`
+ `ModelInvocationLogsCloudWatchDeliverySuccess`
+ `ModelInvocationLogsCloudWatchDeliveryFailure`
+ `ModelInvocationLogsS3DeliverySuccess`
+ `ModelInvocationLogsS3DeliveryFailure`
+ `ModelInvocationLargeDataS3DeliverySuccess`
+ `ModelInvocationLargeDataS3DeliveryFailure`

Untuk mengambil metrik untuk operasi Amazon Bedrock, Anda menentukan informasi berikut:
+ Dimensi metrik. *Dimensi* adalah sekumpulan pasangan nama-nilai yang Anda gunakan untuk mengidentifikasi metrik. Amazon Bedrock mendukung dimensi berikut:
  + `ModelId`— semua metrik
  + `ModelId + ImageSize + BucketedStepSize` – OutputImageCount
+ Nama metrik, seperti `InvocationClientErrors`. 

Anda bisa mendapatkan metrik untuk Amazon Bedrock dengan Konsol Manajemen AWS, the AWS CLI, atau API. CloudWatch Anda dapat menggunakan CloudWatch API melalui salah satu Kit Pengembangan Perangkat AWS Lunak (SDK) atau alat CloudWatch API.

Untuk melihat metrik Amazon Bedrock di CloudWatch konsol, buka bagian metrik di panel navigasi dan pilih opsi semua metrik, lalu cari ID model.

Anda harus memiliki CloudWatch izin yang sesuai untuk memantau Amazon Bedrock dengan CloudWatch Untuk informasi selengkapnya, lihat [Otentikasi dan Kontrol Akses untuk Amazon CloudWatch di Panduan](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/auth-and-access-control-cw.html) Pengguna *Amazon CloudWatch *.