Observabilitas AI generatif

Dengan Amazon CloudWatch, Anda dapat mengamati beban kerja AI generatif, termasuk AgentCore agen Amazon Bedrock, dan mendapatkan wawasan tentang kinerja, kesehatan, dan akurasi AI. CloudWatch menyediakan tampilan pra-konfigurasi ke latensi, penggunaan, dan kesalahan beban kerja AI Anda, memungkinkan Anda mendeteksi masalah lebih cepat dalam komponen seperti model dan agen. End-to-end penelusuran cepat membantu Anda dengan cepat mengidentifikasi masalah dalam komponen seperti basis pengetahuan, alat, dan model. CloudWatchKemampuan pemantauan AI kompatibel dengan kerangka kerja orkestrasi AI generatif populer seperti AWS Strands,, dan LangChain LangGraph, menawarkan fleksibilitas dengan kerangka kerja pilihan Anda.

CloudWatch observabilitas AI generatif memungkinkan Anda untuk:

Menilai kualitas dan akurasi aplikasi AI dalam skala besar melalui pemantauan otomatis, mengurangi persyaratan tinjauan manual dengan menangkap output model, metrik kualitas respons, dan interaksi pengguna akhir
Memantau pemanggilan model, Agen (dikelola, dihosting sendiri, dan pihak ketiga), basis pengetahuan, pagar pembatas, dan alat
Kemajuan dari eksperimen agen hingga produksi aplikasi GenAI inovatif sambil memastikan kualitas, kinerja, dan keandalan yang unggul. Untuk informasi lebih lanjut, lihat Apa itu Amazon Bedrock? AgentCore
Identifikasi sumber kesalahan dengan cepat menggunakan penelusuran cepat ujung ke ujung, metrik yang dikurasi, dan log
Memecahkan masalah di seluruh aplikasi GenAI dan infrastruktur yang mendasarinya, memanfaatkan alat CloudWatch pengamatan yang ada seperti Sinyal Aplikasi, Alarm, Dasbor, Perlindungandata Sensitif, dan Wawasan Log
Akses jejak prompt saat menggunakan Amazon Bedrock, dan kirim jejak terstruktur model pihak ketiga untuk CloudWatch menggunakan ADOT SDK. Untuk informasi tentang menambahkan observabilitas ke AgentCore agen atau alat Amazon Bedrock Anda, lihat Amazon Bedrock AgentCore

CloudWatch observabilitas AI generatif menyediakan dua kemampuan pra-bangun:

catatan

Anda dapat menggunakan dasbor Model Invocation dengan menggunakan model apa pun untuk inferensi di Amazon Bedrock.

Pemanggilan Model — Dasbor metrik terperinci tentang penggunaan model, konsumsi token, dan tabel log pemanggilan yang dikuratori untuk melihat konten input dan output terperinci dari inferensi model
AgentCore Agen Amazon Bedrock — Metrik kinerja dan keputusan untuk primitif Amazon Bedrock AgentCore seperti Agen, Memori, Built-in Alat, Gateway, dan Identitas

Metrik utama yang tersedia di dasbor ini meliputi:

Pemanggilan total dan rata-rata
Penggunaan token (total, rata-rata per kueri, input, output)
Latensi (rata-rata, P90, P99)
Tingkat kesalahan dan peristiwa pelambatan
Atribusi biaya berdasarkan aplikasi, peran pengguna, atau pengguna tertentu

Topik

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Pemecahan masalah

Doa Model