

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 功能儲存概念
<a name="feature-store-concepts"></a>

我們列出 Amazon SageMaker 功能儲存中使用的常用術語，然後列出範例圖表以視覺化方式呈現幾個概念：
+  **Feature Store**：機器學習 (ML) 特徵的儲存和資料管理層。作為儲存、擷取、移除、追蹤、共用、探索和控制功能存取的單一事實來源。在以下範例圖中，Feature Store 是特徵群組的儲存，其中包含您的機器學習 (ML) 資料，並提供其他服務。
+  **線上儲存**：特徵群組的低延遲、高可用性的儲存，可實現即時查詢記錄。線上儲存允許通過 `GetRecord` API 快速存取最新記錄。
+  **離線儲存**放：將歷史資料存放在 Amazon S3 儲存貯體中。當不需要低 (低於一秒) 的延遲讀取時，會使用離線存放區。例如，當您要儲存和提供用於探索、模型訓練和批次推論的功能時，可以使用離線儲存。
+  **特徵群組**：Feature Store 的主要資源，其中包含用於訓練或預測機器學習 (ML) 模型的資料和中繼資料。功能群組是用於描述記錄的功能的邏輯群組。在下列範例圖中，特徵群組包含機器學習 (ML) 資料。
+  **特徵**：用來做為使用機器學習 (ML) 模型進行訓練或預測的輸入之一的屬性。在功能存放區 API 中，功能是記錄的屬性。在下列範例圖中，特徵說明機器學習 (ML) 資料表中的資料行。
+  **功能定義**：由名稱和資料類型之一組成：整數、字串或分數。功能群組包含功能定義的清單。若要取得有關特徵商店資料類型的更多資訊，請參閱[資料類型](feature-store-quotas.md#feature-store-data-types)。
+  **記錄**：單一記錄識別碼的功能值集合。記錄識別碼和事件時間值的組合可獨特地識別功能群組中的記錄。在下列範例圖中，記錄是機器學習 (ML) 資料表中的資料列。
+  **記錄識別碼名稱**：記錄識別碼名稱是識別記錄的功能名稱。它必須參照功能群組的功能定義中定義的功能名稱之一。每個功能群組均使用記錄識別碼名稱定義。
+  **事件時間**：您提供與記錄事件發生時相對應的時間戳記。功能群組中的所有記錄都必須有對應的事件時間。線上儲存僅包含與最新活動時間對應的記錄，而離線儲存則包含所有歷史記錄。如需事件時間格式的詳細資訊，請參閱[資料類型](feature-store-quotas.md#feature-store-data-types)。
+  **擷取**：將新記錄新增特徵群組中。擷取通常是透過 `PutRecord` API 實現的。

**Topics**
+ [

## 概念概觀圖
](#feature-store-concepts-overview)
+ [

## 擷取圖
](#feature-store-concepts-ingestion)

## 概念概觀圖
<a name="feature-store-concepts-overview"></a>

下面的範例圖概念化了一些功能儲存概念：

 ![\[An example representation of a feature group using an example table as reference.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/feature-store/feature-store-feature-group-components.png) 

Feature Store 包含您的特徵群組，而特徵群組包含您的機器學習 (ML) 資料。在範例圖中，原始功能群組包含具有三個功能 (每個功能描述一欄) 和兩個記錄 (列) 的資料表。
+ 功能的定義描述了與記錄相關聯的功能值的功能名稱和資料類型。
+ 記錄包含功能值，並由其記錄標識符唯一標識，並且必須包括事件時間。

## 擷取圖
<a name="feature-store-concepts-ingestion"></a>

擷取是將一筆或多筆記錄加入至既有功能群組的動作。對於不同的儲存體使用案例，線上和離線儲存的更新方式會有所不同。

**擷取至線上儲存範例**

在線儲存充當記錄的實時查找，並僅保留最新的記錄。一旦將新紀錄擷取至現有的線上儲存，更新的線上儲存只會保留事件時間最新的記錄。

在下列範例圖中，原始線上儲存包含其中有一筆記錄的 ML 資料表。擷取的記錄具有與原始記錄相同的記錄識別碼名稱，而且擷取的記錄具有比原始記錄更早的事件時間。由於更新的線上儲存只會保留具有最新事件時間的記錄，因此更新的線上儲存會包含原始記錄。

 ![\[An example showing how records are ingested in the online store.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/feature-store/feature-store-ingestion-online-store.png) 

**擷取至離線儲存範例**

離線儲存充當記錄的歷史查找，並保留所有記錄。將新記錄導入現有的離線存放區後，更新的離線存放區將保留新記錄。

在下列範例圖中，原始離線儲存包含其中有一筆記錄的 ML 資料表。擷取的記錄具有與原始記錄相同的記錄識別碼名稱，而且擷取的記錄具有比原始記錄更早的事件時間。當更新的離線儲存保留所有記錄時，更新的離線儲存會包含這兩筆記錄。

 ![\[An example showing how records are ingested in the offline store.\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/feature-store/feature-store-ingestion-offline-store.png) 