View a markdown version of this page

Amazon Bedrock 비용 및 사용 보고서 데이터 이해 - Amazon Bedrock

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon Bedrock 비용 및 사용 보고서 데이터 이해

AWS 데이터 내보내기 비용 및 사용 보고서(CUR 2.0)는 세부 비용 및 사용 데이터를 수신하는 AWS 데 권장되는 방법입니다. CUR 2.0은 모든 Amazon Bedrock 추론 요청에 대한 라인 항목 세부 정보를 제공합니다. 각 요청은 고유한 사용 유형 및 단가와 함께 각 토큰 유형에 대해 별도의 행 항목을 생성합니다. 이 페이지에서는 CUR에서 Amazon Bedrock 항목을 읽고 실제 지출에 맞게 조정하는 방법을 설명합니다. AWS CUR 2.0에 대한 자세한 내용은 AWS 데이터 내보내기 설명서를 참조하세요.

CUR의 Amazon Bedrock 요금 이해

CUR의 Amazon Bedrock 요금은 토큰 유형, 서비스 계층, 요청이 교차 리전 추론을 통해 라우팅되었는지 여부의 세 가지 요인으로 결정됩니다. 이러한 각 항목을 이해하는 것은 정확한 비용 조정에 필수적입니다.

토큰 유형

Amazon Bedrock 요금은 네 가지 토큰 유형으로 구분됩니다. 각각 단위 가격이 다릅니다.

토큰 유형 CUR 사용 유형 패턴 설명
입력 토큰 *-input-tokens 또는 *-mantle-input-tokens-* 요청 프롬프트에서 전송된 토큰
출력 토큰 *-output-tokens 또는 *-mantle-output-tokens-* 응답에서 생성된 토큰
캐시 읽기 토큰 *-cache-read-input-token-count 프롬프트 캐시에서 읽은 토큰(입력보다 상당히 저렴함)
캐시 쓰기 토큰 *-cache-write-input-token-count 프롬프트 캐시에 기록된 토큰(입력보다 더 높음)
중요

사용량을 지출로 조정할 때는 네 가지 토큰 유형을 모두 고려해야 합니다. 입력 토큰과 출력 토큰만 합산하면 합계가 청구서와 일치하지 않습니다. 이는 조정 격차의 가장 일반적인 원인이며, 특히 프롬프트 캐싱을 많이 사용하는 워크로드의 경우 더욱 그렇습니다.

서비스 티어

Amazon Bedrock은 요금 및 가용성에 영향을 미치는 다양한 서비스 계층을 지원합니다. 요청에 대한 서비스 계층은 CUR 사용 유형에 반영됩니다. 비용을 조정할 때는 각 품목과 연결된 서비스 티어에 대해 올바른 단가를 적용해야 합니다.

서비스 티어 및 추론 요금에 미치는 영향에 대한 자세한 내용은 섹션을 참조하세요성능 및 비용 최적화를 위한 서비스 티어.

CUR 사용 유형 예제

line_item_usage_type 필드는 모델, 토큰 유형, 서비스 계층 및 요청에 교차 리전 추론이 사용되었는지 여부를 식별합니다. 형식은 엔드포인트에 따라 다릅니다.

  • {region}-{model}-{token-type} bedrock-runtime 표준 티어 요청의 경우

  • {region}-{model}-{token-type}-{tier} bedrock-runtime 우선 순위 또는 플렉스 티어 요청의 경우

  • {region}-{model}-mantle-{token-type}-standard bedrock-mantle 요청에 대한

  • {region}-{model}-{token-type}-cross-region-global 리전 간 요청의 경우

사용 유형 모델 서비스 티어 토큰 유형 라우팅
USE1-openai.gpt-oss-120b-mantle-input-tokens-standard OpenAI gpt-oss-120b 표준 Input 리전 내
USE1-gpt-oss-120b-output-tokens-priority OpenAI gpt-oss-120b 우선순위 출력 리전 내
USE1-Nova2.0Lite-input-tokens-flex Amazon Nova 2 Lite Flex Input 리전 내
USE1-Claude4.6Sonnet-input-tokens Claude Sonnet 4.6 표준 Input 리전 내
USE1-Claude4.6Sonnet-cache-read-input-token-count Claude Sonnet 4.6 표준 캐시 읽기 리전 내
USE1-Claude4.6Sonnet-output-tokens-cross-region-global Claude Sonnet 4.6 표준 출력 교차 리전

CUR의 비용 할당 태그

IAM 보안 주체, 프로젝트애플리케이션 추론 프로필의 비용 할당 태그는 접두사 resourceTags/{key} 및와 함께 CUR의 열로 표시됩니다iamPrincipal/{key}. 예를 들어 키가 있는 태그는 로 Team 표시됩니다resourceTags/Team.

속성 메서드 태그가 CUR에 표시되는 방식
IAM 보안 주체 태그 요청하는 IAM 사용자 또는 역할의 태그
세션 태그 역할 가정 또는 페더레이션 중에 전달된 태그
프로젝트 태그 Amazon Bedrock 프로젝트에 할당된 태그
애플리케이션 추론 프로필 태그 애플리케이션 추론 프로파일에 할당된 태그

태그는 CUR에 표시되기 전에 AWS 결제 콘솔에서 비용 할당 태그로 활성화해야 합니다. 자세한 내용은 비용 할당 태그 활성화를 참조하세요.

CUR 데이터를 읽을 때 알아야 할 주요 사항

CUR 데이터를 최대한 활용하고 비용을 분석할 때 혼동을 방지하려면 다음 사항에 유의하세요.

  • 모든 토큰 유형에 대한 계정입니다. Amazon Bedrock은 입력, 출력, 캐시 읽기 및 캐시 쓰기 토큰에 대해 별도로 요금을 부과합니다. 각각 단위 가격이 다릅니다. 입력 및 출력 토큰만 살펴보면 특히 프롬프트 캐싱을 많이 사용하는 워크로드의 경우 분석 비용이 적게 듭니다.

  • 각 라우팅 유형에 올바른 속도를 적용합니다. 리전 내 추론과 리전 간 추론의 단가는 다릅니다. 워크로드가 둘 다 사용하는 경우 비용을 분석할 때 각각에 대해 일치하는 비율을 사용해야 합니다.

  • CUR에서 예상하기 전에 태그를 활성화합니다. 비용 할당 태그는 CUR 또는 Cost Explorer에 표시되기 전에 AWS 결제 콘솔에서 활성화해야 합니다. 활성화 후 태그 채우기가 시작될 때까지 최대 24시간이 걸립니다.

  • IAM 보안 주체 속성에 CUR 2.0을 사용합니다. IAM 보안 주체 자격 증명 및 태그 데이터에는 CUR 2.0(AWS 데이터 내보내기)이 필요합니다. 레거시 CUR 형식을 사용하는 경우 IAM 보안 주체 필드를 사용할 수 없습니다. 토큰당 비용 내역은 두 CUR 형식 모두에서 사용할 수 있습니다. 자세한 설정 지침은 비용 할당을 위한 IAM 보안 주체 사용을 참조하세요.