

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 功能存放區
<a name="feature-store"></a>

使用 [SageMaker AI Feature Store](https://aws.amazon.com/sagemaker/feature-store/) 可提高團隊生產力，因為它會分離元件邊界 （例如，儲存體與用量）。它還提供組織內不同資料科學團隊的功能可重複使用性。

## 使用時間歷程查詢
<a name="time-travel"></a>

Feature Store 中的時間歷程功能有助於重現模型建置，並支援更強大的控管實務。這在組織想要評估資料譜系時很有用，類似於 Git 評估程式碼等版本控制工具的方式。時間歷程查詢也有助於組織為合規檢查提供準確的資料。如需詳細資訊，請參閱 AWS Machine Learning部落格上的[了解 Amazon SageMaker AI Feature Store 的主要功能](https://aws.amazon.com/blogs/machine-learning/understanding-the-key-capabilities-of-amazon-sagemaker-feature-store/)。

## 使用 IAM 角色
<a name="iam-roles"></a>

Feature Store 也有助於提高安全性，而不會影響團隊的生產力和創新。您可以使用 AWS Identity and Access Management (IAM) 角色為特定使用者或群組提供或限制對特定功能的精細存取。

例如，下列政策會限制對 Feature Store 中敏感功能的存取。

```
{
    "Version": "2012-10-17", 		 	 	 		 	 	 
    "Statement": [
        {
            "Sid": "VisualEditor0",
            "Effect": "Deny",
            "Action": "*",
            "Resource": "arn:aws:s3:::amzn-s3-demo-bucket--usw2-az1--x-s3/12345678910/sagemaker/us-east-2/offline-store/doctor-appointments"
        }
    ]
}
```

如需使用特徵商店進行資料安全和加密的詳細資訊，請參閱 SageMaker AI 文件中的[安全和存取控制](https://docs.aws.amazon.com/sagemaker/latest/dg/feature-store-security.html)。

## 使用單位測試
<a name="unit-testing"></a>

當資料科學家根據某些資料建立模型時，他們通常會假設資料的分佈，或執行徹底的分析以完全了解資料屬性。部署這些模型時，模型最終會過時。當資料集過期時，資料科學家、ML 工程師和 （在某些情況下） 自動化系統會使用從線上或離線存放區擷取的新資料重新訓練模型。

不過，此新資料的分佈可能已變更，這可能會影響目前演算法的效能。檢查這些類型問題的自動化方法是從軟體工程借用*單元測試*的概念。要測試的常見項目包括遺失值的百分比、分類變數的基數，以及實際值資料欄是否遵循某些預期的分佈，方法是使用假設測試統計資料 ([*t* 測試](https://en.wikipedia.org/wiki/Student%27s_t-test))。您可能也想要驗證資料結構描述，以確保其未變更，也不會以無提示方式產生無效的輸入功能。

單元測試需要了解資料及其網域，以便您可以規劃在 ML 專案中執行的確切聲明。如需詳細資訊，請參閱 AWS 大數據部落格上的[使用 PyDeequ 大規模測試資料品質](https://aws.amazon.com/blogs/big-data/testing-data-quality-at-scale-with-pydeequ/)。