Observabilitas AI generatif - Amazon CloudWatch

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Observabilitas AI generatif

Dengan Amazon CloudWatch, Anda dapat mengamati beban kerja AI generatif, termasuk AgentCore agen Amazon Bedrock, dan mendapatkan wawasan tentang kinerja, kesehatan, dan akurasi AI. CloudWatch menyediakan tampilan pra-konfigurasi ke latensi, penggunaan, dan kesalahan beban kerja AI Anda, memungkinkan Anda mendeteksi masalah lebih cepat dalam komponen seperti model dan agen. End-to-endpenelusuran cepat membantu Anda dengan cepat mengidentifikasi masalah dalam komponen seperti basis pengetahuan, alat, dan model. CloudWatchKemampuan pemantauan AI kompatibel dengan kerangka kerja orkestrasi AI generatif populer seperti AWS Strands,, dan LangChain LangGraph, menawarkan fleksibilitas dengan kerangka kerja pilihan Anda.

CloudWatch observabilitas AI generatif memungkinkan Anda untuk:

CloudWatch observabilitas AI generatif menyediakan dua kemampuan pra-bangun:

catatan

Anda dapat menggunakan dasbor Model Invocation dengan menggunakan model apa pun untuk inferensi di Amazon Bedrock.

  • Pemanggilan Model — Dasbor metrik terperinci tentang penggunaan model, konsumsi token, dan tabel log pemanggilan yang dikuratori untuk melihat konten input dan output terperinci dari inferensi model

  • AgentCore Agen Amazon Bedrock — Metrik kinerja dan keputusan untuk primitif Amazon Bedrock AgentCore seperti Agen, Memori, Alat Bawaan, Gateway, dan Identitas

Metrik utama yang tersedia di dasbor ini meliputi:

  • Pemanggilan total dan rata-rata

  • Penggunaan token (total, rata-rata per kueri, input, output)

  • Latensi (rata-rata, P90, P99)

  • Tingkat kesalahan dan peristiwa pelambatan

  • Atribusi biaya berdasarkan aplikasi, peran pengguna, atau pengguna tertentu