Beobachtbarkeit der generativen KI - Amazon CloudWatch

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Beobachtbarkeit der generativen KI

Mit Amazon CloudWatch können Sie generative KI-Workloads, einschließlich Amazon AgentCore Bedrock-Agenten, beobachten und Einblicke in die Leistung, den Zustand und die Genauigkeit der KI gewinnen. CloudWatch bietet vorkonfigurierte Ansichten zu Latenz, Nutzung und Fehlern Ihrer KI-Workloads, sodass Sie Probleme in Komponenten wie Modellen und Agenten schneller erkennen können. End-to-endPrompt Tracing hilft Ihnen dabei, Probleme in Komponenten wie Wissensdatenbanken, Tools und Modellen schnell zu identifizieren. CloudWatchDie KI-Überwachungsfunktionen sind mit gängigen Frameworks zur generativen KI-Orchestrierung wie AWS Strands, LangChain, kompatibel und LangGraph bieten Flexibilität bei der Wahl des Frameworks.

CloudWatch Die generative KI-Observability ermöglicht Ihnen:

CloudWatch generative KI-Observability bietet zwei vorgefertigte Funktionen:

Anmerkung

Sie können das Model Invocation-Dashboard verwenden, indem Sie beliebige Modelle für Inferenz in Amazon Bedrock verwenden.

  • Model Invocations — Detailliertes Metrik-Dashboard zur Modellnutzung und zum Token-Verbrauch sowie eine kuratierte Tabelle mit Aufruf-Logs, um detaillierte Eingabe- und Ausgabeinhalte von Modellinferenzen einzusehen

  • Amazon AgentCore Bedrock-Agenten — Leistungs- und Entscheidungsmetriken für Primitive von Amazon Bedrock AgentCore wie Agenten, Arbeitsspeicher, integrierte Tools, Gateways und Identität

Zu den wichtigsten in diesen Dashboards verfügbaren Metriken zählen:

  • Gesamtzahl und durchschnittliche Aufrufe

  • Token-Nutzung (gesamt, Durchschnitt pro Abfrage, Eingabe, Ausgabe)

  • Latenz (durchschnittlich, P90, P99)

  • Fehlerraten und Ereignisse, die zur Drosselung führen

  • Kostenzuweisung nach Anwendung, Benutzerrolle oder spezifischem Benutzer