8. 継続的なトレーニング - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

8. 継続的なトレーニング

継続的トレーニングとは、ML システムが機械学習モデルを自動的かつ継続的に再トレーニングして、再デプロイされる前にデータの変化に適応させることを意味します。再構築のトリガーには、データの変化、モデルの変化、コードの変化などがあります。

8.1 チェック: モデル入力の検証

モデルの入力が特定の標準から逸脱していないことを確認するためのチェック機能が設定されています。入力検証とは、モデルの昇格中に機能テストを実行することを意味します。また、アサーションや列挙型を使用するなど、入力リクエストを即座に検証することも意味します。

8.2 再トレーニングのトリガー: スケジュールされたジョブ

これはトレーニング自動化の最も基本的な形式です。モデルの再トレーニングはスケジュールに従って設定されます (毎週など)。このシナリオでは、モデルの昇格前に手動によるレビューと結果のスポットチェックを行うため、自動化レベルは低い可能性があります。

8.3 再トレーニングのトリガー: 新しいトレーニングデータ

再トレーニングは、受信データのしきい値によって開始されます。モデルはゼロから再トレーニングすることも、更新を段階的に実行することもできます。データが所定の量になると、トレーニングジョブが開始されます。

8.4 再トレーニングのトリガー: モデルのパフォーマンス低下

この手法では、モニタリングとオブザーバビリティを使用してモデルの再トレーニングを実行します。成熟した自動化レベルが必要です。例えば、精度が特定の範囲よりも低下すると、これがトリガーとなってデータの全部または一部でモデルを再トレーニングします。

8.5 再トレーニングのトリガー: データ分布シフト

データ分布シフトをモニタリングすると、基になるデータが変更されたときにモデルを再トレーニングする方法セットトリガーが提供されます。概念シフトまたはデータ分布シフトで設定された違反が発生すると、モデルの再トレーニングジョブが開始されます。