翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
特徴量ストア
SageMaker AI Feature Store
タイムトラベルクエリを使用する
Feature Store のタイムトラベル機能は、モデル構築を再現し、より強力なガバナンスプラクティスをサポートします。これは、Git などのバージョン管理ツールがコードを評価する方法と同様に、組織がデータ系統を評価する場合に便利です。タイムトラベルクエリは、組織がコンプライアンスチェックのために正確なデータを提供するのにも役立ちます。詳細については、 AWS Machine Learning ブログのAmazon SageMaker AI Feature Store の主な機能
IAM ロールの使用
Feature Store は、チームの生産性やイノベーションに影響を与えることなく、セキュリティの向上にも役立ちます。 AWS Identity and Access Management (IAM) ロールを使用して、特定のユーザーまたはグループの特定の機能へのきめ細かなアクセスを許可または制限できます。
たとえば、次のポリシーでは、Feature Store の機密機能へのアクセスを制限します。
{ "Version": "2012-10-17", "Statement": [ { "Sid": "VisualEditor0", "Effect": "Deny", "Action": "*", "Resource": "arn:aws:s3:::us-east-2-12345678910-features/12345678910/sagemaker/us-east-2/offline-store/doctor-appointments" } ] }
Feature Store を使用したデータセキュリティと暗号化の詳細については、SageMaker AI ドキュメントの「セキュリティとアクセスコントロール」を参照してください。
ユニットテストを使用する
データサイエンティストが一部のデータに基づいてモデルを作成する場合、データの分布について仮定することも、データプロパティを完全に理解するために徹底的な分析を実行することもあります。これらのモデルがデプロイされると、最終的には古くなります。データセットが古くなると、データサイエンティスト、ML エンジニア、および (場合によっては) 自動システムは、オンラインまたはオフラインストアから取得される新しいデータでモデルを再トレーニングします。
ただし、この新しいデータの分散が変更され、現在のアルゴリズムのパフォーマンスに影響する可能性があります。これらのタイプの問題をチェックする自動化された方法は、ソフトウェアエンジニアリングからユニットテストの概念を借用することです。テストする一般的な問題には、欠損値の割合、カテゴリ変数の基数、仮説テスト統計 (t テスト
ユニットテストでは、ML プロジェクトの一部として実行する正確なアサーションを計画できるように、データとドメインを理解する必要があります。詳細については、 AWS ビッグデータブログのPyDeequ を使用した大規模なデータ品質のテスト