

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 처리량 모드
<a name="feature-store-throughput-mode"></a>

Amazon SageMaker Feature Store는 온디맨드(`On-demand`) 및 프로비저닝된(`Provisioned`) 처리량 모드라는 두 가지 요금 모델을 제공합니다. `On-demand`는 예측 불가능한 트래픽에 가장 적합하고, `Provisioned`는 일관되고 예측 가능한 트래픽에 가장 적합합니다.

애플리케이션 트래픽 패턴이 변경되거나 예측이 불가능한 기간을 수용하기 위해 지정된 특성 그룹에 대해 `On-demand` 및 `Provisioned` 처리량 모드 간에 전환할 수 있는 옵션이 있습니다. 특성 그룹 처리량 모드는 24시간 동안 한 번만 `On-demand`로 업데이트할 수 있습니다. 처리량 모드는 [UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html) API를 사용해 프로그래밍 방식으로 또는 콘솔 UI를 통해 업데이트할 수 있습니다. 콘솔 사용 방법에 대한 자세한 내용은 [콘솔에서 Amazon SageMaker Feature Store 사용](feature-store-use-with-studio.md) 섹션을 참조하세요.

`Provisioned` 처리량 모드는 오프라인 전용 특성 그룹 또는 `Standard` 스토리지 유형을 사용하는 특성 그룹에서 사용할 수 있습니다. 다른 스토리지 구성의 경우 `On-demand` 처리량 모드가 사용됩니다. 온라인 및 오프라인 스토리지 구성에 대한 자세한 내용은 각각 [온라인 저장소](feature-store-storage-configurations-online-store.md) 및 [오프라인 저장소](feature-store-storage-configurations-offline-store.md) 섹션을 참조하세요.

요금에 대한 자세한 내용은 [Amazon SageMaker 요금](https://aws.amazon.com/sagemaker/pricing/)을 참조하세요.

**Topics**
+ [온디맨드 처리량 모드](#feature-store-throughput-mode-on-demand)
+ [프로비저닝된 처리량 모드](#feature-store-throughput-mode-provisioned)
+ [처리량 모드 지표](#feature-store-throughput-mode-metrics)
+ [처리량 모드 한도](#feature-store-throughput-mode-limits)

## 온디맨드 처리량 모드
<a name="feature-store-throughput-mode-on-demand"></a>

`On-demand`(기본값) 처리량 모드는 워크로드를 알 수 없고 애플리케이션 트래픽을 예측할 수 없는 특성 그룹을 사용하며 용량 요구 사항을 예측할 수 없는 경우에 가장 적합합니다.

`On-demand` 모드에서는 애플리케이션이 특성 그룹에서 수행하는 읽기 및 쓰기에 대해 요금이 부과됩니다. Feature Store는 늘어나거나 줄어드는 워크로드를 즉시 수용하기 때문에 애플리케이션에서 수행할 것으로 예상되는 읽기 및 쓰기 처리량을 지정할 필요가 없습니다. `ReadRequestsUnits` 및 `WriteRequestsUnits`에서 측정되는 사용량에 대해서만 비용을 지불합니다.

[CreateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateFeatureGroup.html) 또는 [UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html) API를 사용하거나 콘솔 UI를 통해 `On-demand` 처리량 모드를 활성화할 수 있습니다. 콘솔 UI 사용 방법에 대한 자세한 내용은 [콘솔에서 Amazon SageMaker Feature Store 사용](feature-store-use-with-studio.md) 섹션을 참조하세요.

**중요**  
특성 그룹 처리량 모드는 24시간 동안 한 번만 `On-demand`로 업데이트할 수 있습니다.

## 프로비저닝된 처리량 모드
<a name="feature-store-throughput-mode-provisioned"></a>

`Provisioned` 처리량 모드는 워크로드가 예측 가능한 특성 그룹을 사용하며 비용을 통제하기 위해 용량 요구 사항을 예측할 수 있을 때 가장 적합합니다. 이 모드를 사용하면 처리량 요구 사항을 미리 예상할 수 있는 특정 워크로드에 대해 비용 효과가 높아질 수 있습니다.

특성 그룹을 `Provisioned` 모드로 설정하면 애플리케이션이 특성 그룹에서 사용할 수 있는 최대 용량인 용량 단위를 지정합니다. 애플리케이션에서 이 `Provisioned` 처리량 용량을 초과할 경우 스로틀링 요청이 적용됩니다.

아래에 읽기 및 쓰기 용량 단위에 대한 정보가 나와 있습니다.
+ `GetRecord` API를 사용하여 최대 4KB의 단일 레코드를 검색하면 *최소* 1개의 RCU(읽기 용량 단위)를 사용합니다. 더 큰 페이로드를 검색하려면 더 많은 RCU가 사용될 수 있습니다. 필요한 총 읽기 용량 단위 수는 Feature Store 서비스에서 추가하는 레코드당 작은 메타데이터를 포함하여 항목 크기에 따라 달라집니다.
+ `PutRecord` API를 사용한 페이로드가 1KB인 단일 쓰기 요청은 *최소* 1개의 WCU(쓰기 용량 단위)를 소비하며, 분수 페이로드는 가장 가까운 KB로 반올림됩니다. 이벤트 시간, 레코드의 삭제 상태 및 Time to Live(TTL) 상태에 따라 더 많이 소비될 수 있습니다. TTL에 대한 자세한 내용은 [레코드의 TTL (Time to live) 기간](feature-store-time-to-live.md) 섹션을 참조하세요.

**중요**  
용량 단위를 설정할 때 다음을 고려하세요.  
`Provisioned` 용량을 완전히 활용하지 않더라도 특성 그룹에 대해 프로비저닝하는 읽기 및 쓰기 용량에 대한 요금이 부과됩니다.
읽기 또는 쓰기 용량을 너무 낮게 설정하면 요청에 스로틀링이 적용될 수 있습니다.
경우에 따라 레코드는 다양한 특성을 활성화하기 위해 Feature Store 서비스에서 추가하는 레코드 수준 메타데이터로 인해 추가 용량 단위를 사용할 수 있습니다.
`GetRecord` 또는 `BatchGetRecord` API를 사용하여 특성의 하위 집합만 검색해도 여전히 전체 레코드에 해당하는 RCU가 사용됩니다.
쓰기 용량의 경우 많은 수의 기록 쓰기가 발생할 수 있는 채우기 또는 대량 수집을 수행할 때 스로틀링을 방지하기 위해 최근 피크 용량의 2배를 프로비저닝해야 합니다. 이는 기록 레코드 작성이 추가 쓰기 용량을 소비하기 때문입니다.
Feature Store는 현재 `Provisioned` 모드에 대한 오토 스케일링을 지원하지 않습니다.

[CreateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateFeatureGroup.html) 또는 [UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html) API를 사용하거나 콘솔 UI를 통해 `On-demand` 처리량 모드를 활성화할 수 있습니다. 콘솔 UI 사용 방법에 대한 자세한 내용은 [콘솔에서 Amazon SageMaker Feature Store 사용](feature-store-use-with-studio.md) 섹션을 참조하세요.

다음은 `Provisioned` 모드가 활성화될 때 특성 그룹의 RCU 및 WCU 처리량을 늘리거나 줄이는 방법을 설명합니다.

**프로비저닝된 처리량 늘리기**

[UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html) API 또는 콘솔 UI를 사용하여 필요한 만큼 자주 RCU 또는 WCU를 늘릴 수 있습니다.

**프로비저닝된 처리량 줄이기**

[UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html) API 또는 콘솔 UI를 사용하여 특성 그룹의 RCU 및 WCU(또는 둘 다)를 줄일 수 있습니다.

특성 그룹에서 하루에 수행할 수 있는 `Provisioned` 용량 감소 횟수에는 기본 할당량이 있습니다. 하루는 협정 세계시(UTC)에 따라 정의됩니다. 특정 일에 아직 용량 감소를 수행하지 않은 경우 한 시간 내에 최대 4회 용량 감소를 수행할 수 있습니다. 그 후에는 이전 시간에 용량 감소를 수행하지 않았다면 시간당 1회 추가 용량 감소를 수행할 수 있습니다. 이에 따라 하루에 줄일 수 있는 최대 횟수를 27회로 설정할 수 있습니다(처음 1시간 동안 4회 줄이기, 이후 1시간마다 1회 줄이기(당일 기준)).

## 처리량 모드 지표
<a name="feature-store-throughput-mode-metrics"></a>

`On-demand` 모드의 특성 그룹은 `ConsumedReadRequestsUnits` 및 `ConsumedWriteRequestsUnits` 지표를 내보냅니다. `Provisioned` 모드의 특성 그룹은 `ConsumedReadCapacityUnits` 및 `ConsumedWriteCapacityUnits` 지표를 내보냅니다. Feature Store 지표에 대한 자세한 내용은 [Amazon SageMaker 특성 스토어 지표](monitoring-cloudwatch.md#cloudwatch-metrics-feature-store) 섹션을 참조하세요.

## 처리량 모드 한도
<a name="feature-store-throughput-mode-limits"></a>

각 AWS 계정 에는 가용성을 보장하고 결제 위험을 관리하는 데 도움이 되도록 적용되는 기본 서비스 할당량 또는 한도가 있습니다. 기본 할당량과 한도에 대한 자세한 내용은 [할당량, 이름 지정 규칙 및 데이터 형식](feature-store-quotas.md) 섹션을 참조하세요.

경우에 따라 이러한 한도가 설명서에 명시된 한도보다 낮을 수 있습니다. 이 한도를 늘려야 하는 경우 증가 요청을 제출할 수 있습니다. 작업 중단을 방지하기 위해 기존 한도에 도달하기 전에 요청하는 것이 좋습니다. 서비스 할당량과 할당량 증가를 요청하는 방법에 대한 자세한 내용은 [AWS 서비스 할당량](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html)을 참조하세요.