本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
輸送量模式
Amazon SageMaker Feature Store 提供兩種定價模式供您選擇:隨需 (On-demand) 和佈建 (Provisioned) 輸送量模式。On-demand 最適合不太可預測的流量,而 Provisioned 最適合一致且可預測的流量。
您可以選擇在特定特徵群組的 On-demand 與 Provisioned 輸送量模式之間切換,以適應應用程式流量模式變化或難以預測的期間。您每 24 小時只能將特徵群組輸送量模式更新為 On-demand 一次。您可以使用 UpdateFeatureGroup API 或透過主控台 UI,以程式設計方式更新輸送量模式。如需使用主控台的詳細資訊,請參閱在主控台中使用 Amazon SageMaker Feature Store。
您可以使用 Provisioned 輸送量模式搭配僅限離線的特徵群組,或搭配儲存類型為 Standard 的特徵群組。對於其他儲存組態,會使用 On-demand 輸送量模式。如需線上和離線儲存組態的相關資訊,請分別參閱線上儲存和離線儲存。
如需定價的詳細資訊,請參閱 Amazon SageMaker 定價
隨需輸送量模式
當您使用特徵群組搭配未知工作負載、無法預測的應用程式流量,而且無法預測容量要求時,On-demand (預設) 輸送量模式最適合。
On-demand 模式會針對應用程式在特徵群組上執行的讀取和寫入向您收費。您不需要指定您期望應用程式執行的讀取和寫入輸送量,因為 Feature Store 會在工作負載增加或減少時立即適應它們。您只需按使用量付費,這是在 ReadRequestsUnits 和 WriteRequestsUnits 中測量得來的。
您可以使用 CreateFeatureGroup 或 UpdateFeatureGroup API 或透過主控台 UI 啟用 On-demand 輸送量模式。如需使用主控台 UI 的詳細資訊,請參閱 在主控台中使用 Amazon SageMaker Feature Store。
重要
您每 24 小時只能將特徵群組輸送量模式更新為 On-demand 一次。
佈建輸送量模式
當您使用特徵群組搭配可預測工作負載,而且可以預測容量要求以控制成本時,Provisioned 輸送量模式最適合。這可以讓某些工作負載更具成本效益,您可以在這些工作負載中預先預期輸送量要求。
當您將特徵群組設定為 Provisioned 模式時,您可以指定容量單位,這是應用程式可以從特徵群組耗用的容量上限。如果您的應用程式超過此 Provisioned 輸送容量,將會請求限流。
下列包含讀取和寫入容量單位的相關資訊。
-
使用
GetRecordAPI 擷取最多 4 KB 的單一記錄將會耗用至少 1 個 RCU (讀取容量單位)。擷取更大的承載可能需要更多時間。所需的讀取容量單位總數取決於項目大小,包括 Feature Store 服務新增的小型每筆記錄中繼資料。 -
使用
PutRecordAPI 且承載為 1 KB 的單一寫入請求將耗用至少 1 個 WCU (寫入容量單位),小數承載會四捨五入至最接近的 KB。它可能會耗用更多容量,取決於事件時間、記錄的刪除狀態,以及存留時間 (TTL) 狀態。如需 TTL 的詳細資訊,請參閱 存留時間 (TTL) 記錄持續時間。
重要
設定容量單位時,請考慮下列事項:
-
即使您未充分利用
Provisioned容量,仍將會針對您為特徵群組佈建的讀取和寫入容量向您收費。 -
如果您設定的讀取或寫入容量太低,您的請求可能會遇到限流。
-
在某些情況下,記錄可能會由於 Feature Store 服務新增的記錄層級中繼資料而耗用額外的容量單位,以啟用各種功能。
-
使用
GetRecord或BatchGetRecordAPI 僅擷取功能子集仍會耗用與整個記錄對應的 RCU。 -
對於寫入容量,您應該佈建最近峰值容量的 2 倍,以避免在執行回填或大量擷取時發生限流,這可能會導致大量的歷程記錄寫入。這是因為寫入歷程記錄會耗用額外的寫入容量。
-
Feature Store 目前不支援
Provisioned模式的自動擴展。
您可以使用 CreateFeatureGroup 或 UpdateFeatureGroup API 或透過主控台 UI 啟用 On-demand 輸送量模式。如需使用主控台 UI 的詳細資訊,請參閱 在主控台中使用 Amazon SageMaker Feature Store。
以下描述如何在 Provisioned 模式啟用時,增加或減少特徵群組的 RCU 和 WCU 輸送量。
增加佈建輸送量
您可以使用 UpdateFeatureGroup API 或主控台 UI,視需要增加 RCU 或 WCU。
降低佈建輸送量
您可以使用 UpdateFeatureGroup API 或主控台 UI 來減少特徵群組的 RCU 和 WCU (或兩者)。
您每天可以在特徵群組上執行的 Provisioned 容量減少次數存在預設配額。一天是根據國際標準時間 (UTC) 來定義。在給定的一天,只要您在當天還沒有執行任何其他減少,您可以在一小時內執行最多四次減少。隨後,只要前一小時沒有減少,您就可以每小時執行一次額外的減少。一天的調降次數最多可達 27 次 (第一個小時的 4 次調降,加上一天中後續每 1 小時 1 次的調降)。
輸送量模式指標
On-demand 模式中的特徵群組將發出 ConsumedReadRequestsUnits 和 ConsumedWriteRequestsUnits 指標。Provisioned 模式中的特徵群組將發出 ConsumedReadCapacityUnits 和 ConsumedWriteCapacityUnits 指標。如需 Feature Store 指標的詳細資訊,請參閱 Amazon SageMaker Feature Store 指標。
輸送量模式限制
每個 AWS 帳戶都有套用的預設服務配額或限制,以協助確保可用性和管理帳單風險。如需預設配額和限制的相關資訊,請參閱配額、命名規則與資料類型。
在某些情況下,這些限制可能會低於文件中所述的限制。如果您需要更高的限制,您可以提交請求以提高配額。在達到目前的限制之前,最好先這麼做,以避免您的工作中斷。如需服務配額以及如何請求提高配額的詳細資訊,請參閱 AWS 服務配額。