생성형 AI 관찰성 - Amazon CloudWatch

생성형 AI 관찰성

Amazon CloudWatch를 사용하면 Amazon Bedrock AgentCore 에이전트를 포함한 생성형 AI 워크로드를 관찰하고 AI 성능, 상태 및 정확도에 대한 인사이트를 얻을 수 있습니다. CloudWatch는 AI 워크로드의 지연 시간, 사용량 및 오류에 대해 미리 구성된 보기를 제공하므로 이를 통해 모델 및 에이전트와 같은 구성 요소에서 문제를 더 빠르게 감지할 수 있습니다. 포괄적인 프롬프트 추적을 사용하면 지식 기반, 도구 및 모델과 같은 구성 요소에서 문제를 빠르게 식별할 수 있습니다. CloudWatch의 AI 모니터링 기능은 AWS Strands, LangChain, LangGraph와 같은 인기 있는 생성형 AI 오케스트레이션 프레임워크와 호환되므로 선택한 프레임워크에 유연성을 제공합니다.

CloudWatch 생성형 AI 관찰성을 통해 다음을 지원할 수 있습니다.

  • 인간 참여형(HITL) 평가 부담을 줄이면서 최종 사용자의 성과, AI 성능, 상태 및 정확도에 대한 인사이트 확보

  • 모델 간접 호출, 에이전트(관리형, 자체 호스팅 및 타사), 지식 기반, 가드레일 및 도구 모니터링

  • 우수한 품질, 성능 및 신뢰성을 보장하면서 에이전트 실험에서 혁신적인 GenAI 애플리케이션 제작까지 개발을 주도합니다. 자세한 내용은 What is Amazon Bedrock AgentCore?를 참조하세요.

  • 포괄적인 프롬프트 추적, 선별된 지표 및 로그를 사용하여 오류의 원인 빠르게 식별

  • Application Signals, 경보, 대시보드, 민감한 데이터 보호Logs Insights와 같은 기존 CloudWatch 관찰성 도구를 활용하여 전체 GenAI 애플리케이션 및 기본 인프라에서 문제 해결

  • Amazon Bedrock을 사용하는 동안 프롬프트 트레이스에 액세스하고 ADOT SDK를 사용하여 타사 모델의 구조화된 트레이스를 CloudWatch로 전송합니다. Amazon Bedrock AgentCore 에이전트 또는 도구에 관찰성을 추가하는 방법에 대한 자세한 내용은 Amazon Bedrock AgentCore를 참조하세요.

CloudWatch 생성형 AI 관찰성은 두 가지 사전 구축된 대시보드를 제공합니다.

참고

모델 간접 호출 대시보드를 보려면 Amazon Bedrock을 활성화해야 합니다.

  • 모델 간접 호출 - 모델 사용량, 토큰 소모 및 비용에 대한 자세한 지표

  • Amazon Bedrock AgentCore 에이전트 - Amazon Bedrock 에이전트의 성능 및 의사 결정 지표

이러한 대시보드에서 사용할 수 있는 주요 지표로 다음이 포함됩니다.

  • 간접 호출 총계 및 평균

  • 토큰 사용량(총계, 쿼리당 평균, 입력, 출력)

  • 지연 시간(평균, P90, P99)

  • 오류 발생률 및 스로틀링 이벤트

  • 애플리케이션, 사용자 역할 또는 특정 사용자별 비용 어트리뷰션