

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# 特徴量ストア
<a name="feature-store"></a>

[SageMaker AI Feature Store](https://aws.amazon.com/sagemaker/feature-store/) を使用すると、コンポーネントの境界 (ストレージと使用状況など) が切り離されるため、チームの生産性が向上します。また、組織内のさまざまなデータサイエンスチーム間で機能の再利用性を提供します。

## タイムトラベルクエリを使用する
<a name="time-travel"></a>

Feature Store のタイムトラベル機能は、モデル構築を再現し、より強力なガバナンスプラクティスをサポートします。これは、Git などのバージョン管理ツールがコードを評価する方法と同様に、組織がデータ系統を評価する場合に便利です。タイムトラベルクエリは、組織がコンプライアンスチェックのために正確なデータを提供するのにも役立ちます。詳細については、 AWS Machine Learning ブログの[Amazon SageMaker AI Feature Store の主な機能](https://aws.amazon.com/blogs/machine-learning/understanding-the-key-capabilities-of-amazon-sagemaker-feature-store/)を理解する」を参照してください。

## IAM ロールの使用
<a name="iam-roles"></a>

Feature Store は、チームの生産性やイノベーションに影響を与えることなく、セキュリティの向上にも役立ちます。 AWS Identity and Access Management (IAM) ロールを使用して、特定のユーザーまたはグループの特定の機能へのきめ細かなアクセスを許可または制限できます。

たとえば、次のポリシーは Feature Store の機密機能へのアクセスを制限します。

```
{
    "Version": "2012-10-17", 		 	 	 		 	 	 
    "Statement": [
        {
            "Sid": "VisualEditor0",
            "Effect": "Deny",
            "Action": "*",
            "Resource": "arn:aws:s3:::amzn-s3-demo-bucket--usw2-az1--x-s3/12345678910/sagemaker/us-east-2/offline-store/doctor-appointments"
        }
    ]
}
```

Feature Store を使用したデータセキュリティと暗号化の詳細については、SageMaker AI ドキュメントの[「セキュリティとアクセスコントロール](https://docs.aws.amazon.com/sagemaker/latest/dg/feature-store-security.html)」を参照してください。

## ユニットテストを使用する
<a name="unit-testing"></a>

データサイエンティストが一部のデータに基づいてモデルを作成する場合、データの分布について仮定することも、データプロパティを完全に理解するために徹底的な分析を実行することもあります。これらのモデルがデプロイされると、最終的には古くなります。データセットが古くなると、データサイエンティスト、ML エンジニア、および (場合によっては) 自動システムは、オンラインまたはオフラインストアから取得される新しいデータでモデルを再トレーニングします。

ただし、この新しいデータの分散が変更され、現在のアルゴリズムのパフォーマンスに影響する可能性があります。これらのタイプの問題をチェックする自動化された方法は、ソフトウェアエンジニアリングから*ユニットテスト*の概念を借用することです。テストする一般的な問題には、欠損値の割合、カテゴリ変数の基数、仮説テスト統計 ([*t* テスト](https://en.wikipedia.org/wiki/Student%27s_t-test)) などのフレームワークを使用して、実際の値列が予想される分布に準拠しているかどうかなどがあります。また、データスキーマを検証して、データスキーマが変更されておらず、無効な入力機能がサイレントに生成されないようにすることもできます。

ユニットテストでは、ML プロジェクトの一部として実行する正確なアサーションを計画できるように、データとドメインを理解する必要があります。詳細については、 AWS ビッグデータブログの[PyDeequ を使用した大規模なデータ品質のテスト](https://aws.amazon.com/blogs/big-data/testing-data-quality-at-scale-with-pydeequ/)」を参照してください。