에이전트 보기 - Amazon CloudWatch

에이전트 보기

에이전트 보기에서는 계정의 에이전트에 대해 선별된 대시보드를 제공합니다. AgentCore 런타임, Lambda 또는 Amazon EC2와 같은 AWS 네이티브 서비스에 호스팅되는 에이전트의 데이터를 볼 수 있습니다. 보기에는 CloudWatch로 원격 측정을 내보내는 에이전트도 표시됩니다.

개요

지표 및 대시보드에는 샘플링된 에이전트 스팬의 데이터가 표시됩니다. 에이전트 스팬에 대한 자세한 내용은 Spans를 참조하세요.

다음과 같은 에이전트 지표가 지원됩니다.

  • 에이전트/엔드포인트 - 스팬을 내보내는 계측된 에이전트 및 별칭 수

  • 세션 - 스팬을 내보내는 계측된 에이전트가 생성한 세션 수. 세션은 대화와 유사하며 광범위한 컨텍스트를 포함합니다.

  • 트레이스 - 스팬을 내보내는 계측된 에이전트가 생성한 트레이스 수. 트레이스는 세션 내 개별 요청-응답 주기입니다.

  • 오류 발생률 - 에이전트 상호 작용에서 발생하는 오류 백분율

  • 스로틀 속도 - 스로틀링된 에이전트 상호 작용의 백분율

세부 정보 보기를 선택하여 그래프에서 에이전트 지표를 확인합니다.

에이전트 보기

런타임 지표

런타임 지표 및 대시보드에는 런타임 기본 유형의 데이터가 표시됩니다. 이 기본 유형을 사용하면 Amazon Bedrock AgentCore 런타임에서 에이전트를 호스팅할 수 있습니다. 자세한 내용은 Creating an AgentCore Runtime을 차조하세요.

AgentCore 런타임은 다음과 같은 지표를 지원합니다.

  • 런타임 에이전트/별칭 - AgentCore 런타임에 호스팅되는 에이전트 및 별칭 수 추적

  • 런타임 세션 - AgentCore 런타임에서 실행 중인 에이전트가 생성한 세션 수를 추적합니다. 세션은 대화와 유사하며 전체 상호 작용 흐름에서 광범위한 컨텍스트를 포함합니다. 전체 플랫폼 사용량, 용량 계획을 모니터링하고 사용자 참여 패턴을 이해하는 데 유용함

  • 런타임 간접 호출 - 데이터 플레인 API에 대한 총 요청 수. 각 API 직접 호출은 요청 페이로드 크기 또는 응답 상태에 관계없이 하나의 간접 호출로 계산됩니다.

  • 런타임 오류 - 시스템 및 사용자 오류 수. 시스템 및 사용자 오류 정의는 AgentCore provided runtime metrics를 참조하세요.

  • 런타임 스로틀 - 허용된 초당 트랜잭션 수(TPS)를 초과하여 서비스에 의해 스로틀링되는 요청 수. 이러한 요청은 HTTP 상태 코드 429와 함께 ThrottlingException을 반환합니다. 이 지표를 모니터링하여 서비스 할당량을 검토해야 하는지, 요청 패턴을 최적화해야 하는지 여부를 결정합니다.

기본 대시보드에서 시간 경과에 따른 지표 변경 사항을 봅니다. 세부 정보 보기를 확장하여 지표 그래프를 표시합니다.

런타임 보기

에이전트

에이전트는 애플리케이션에서 모니터링 데이터를 수집하고 전송하는 구성 요소입니다. 에이전트 테이블에는 계정에 구성된 모든 에이전트가 표시됩니다. 이러한 에이전트는 AgentCore 런타임, Lambda 또는 Amazon EC2와 같은 AWS 네이티브 서비스에서 호스팅할 수 있습니다. 이 테이블에는 CloudWatch에 원격 측정을 내보내도록 구성된 다른 에이전트도 표시됩니다.

에이전트 필터링을 사용하여 심층 분석하려는 특정 에이전트를 찾거나 열 이름을 기반으로 에이전트를 정렬하여 필요한 에이전트를 찾을 수도 있습니다. 톱니 아이콘을 선택하여 추가 열을 표시하거나 숨깁니다.

런타임 에이전트 보기

에이전트 이름을 확장하여 에이전트의 세부 정보를 볼 수 있습니다.

런타임 에이전트 개요

에이전트 세부 정보 - 개요

개요 탭에는 에이전트 지표에 대한 자동 대시보드가 표시됩니다. 이러한 지표는 샘플링된 스팬 및 런타임 지표(에이전트가 AgentCore 런타임을 사용하는 경우)에서 가져옵니다.

평가자 대시보드에는 평가가 활성화된 스팬에서 파생된 인사이트가 포함됩니다.

  • 평가자 점수의 상위 델타 - 선택한 기간을 기준으로 마지막 기간 이후 가장 많은 변동이 발생한 에이전트 평가자가 표시됩니다.

  • 평가 구성 지표 - 평가 실행 횟수와 오류 발생 횟수를 포함하여, 에이전트 평가자의 운영 상태 지표가 표시됩니다.

Amazon Bedrock AgentCore 콘솔을 사용하여 평가 구성을 편집하려면 평가자 또는 평가 구성 열의 링크를 클릭합니다. 평가자 결과를 검토하려면 평균 점수 열에서 점수를 클릭합니다. 에이전트에 대한 모든 평가를 보려면 평가 탭을 선택합니다. 자세한 내용은 에이전트 세부 정보 - 평가 섹션을 참조하세요.

에이전트 지표 대시보드에는 샘플링된 스팬에서 파생된 지표가 포함됩니다.

  • 세션 및 트레이스 - 이 에이전트의 세션 및 트레이스 수

  • FM 토큰 사용량 - 총 기본 모델 토큰 소모 수. 차트를 특정 기본 모델로 필터링할 수 있습니다.

  • 시스템 및 클라이언트 오류 - 요청 처리 중 발생하는 시스템 오류 수. 높은 수준의 서버 측 오류에서는 조사가 필요한 잠재적 인프라 또는 서비스 문제를 나타낼 수 있습니다. 클라이언트 오류는 유효하지 않은 요청으로 인해 발생하는 오류입니다. 높은 수준의 클라이언트 측 오류에서는 요청 형식 또는 권한 관련 문제를 나타낼 수 있습니다.

  • 스팬별 오류 및 지연 시간 - 특정 스팬별 오류 발생률 및 지연 시간. 스팬은 많은 에이전트에서 나타날 수 있습니다.

  • 스로틀 - 허용된 초당 트랜잭션 수(TPS)를 초과하여 서비스에 의해 스로틀링되는 요청 수

  • 인바운드 인증: 승인 및 액세스 토큰 직접 호출 - 에이전트가 처리한 수신 인증 요청 수. 여기에는 외부 클라이언트 또는 서비스의 권한 부여 확인 및 액세스 토큰 검증이 포함됩니다.

  • 아웃바운드 인증: 사용량 분포 - 에이전트가 사용하는 아웃바운드 인증 방법의 분포 패턴으로, 외부 서비스에 액세스할 때 사용되는 인증 메커니즘의 빈도와 유형을 보여줍니다.

런타임 지표 대시보드에는 AgentCore 런타임이 자동으로 생성하는 지표가 포함되어 있습니다.

  • 런타임 세션 및 간접 호출 - 런타임에 호스팅되는 동안 이 특정 에이전트가 생성하는 세션 및 간접 호출 수

  • 런타임 지연 시간 - 런타임에 호스팅되는 에이전트의 요청 지연 시간

  • 런타임 스로틀 - 허용된 초당 트랜잭션 수(TPS)를 초과하여 서비스에 의해 스로틀링되는 요청 수