Amazon SageMaker AI の TensorBoard - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon SageMaker AI の TensorBoard

Amazon SageMaker AI with TensorBoard は Amazon SageMaker の機能で、TensorBoard の視覚化ツールを SageMaker AI に導入し、SageMaker AI トレーニングおよびドメインと統合したものです。SageMaker AI ドメインを通じて AWS アカウントとアカウントに属するユーザーを管理したり、ドメインユーザーに Amazon S3 への適切なアクセス許可を使用する TensorBoard データへのアクセスを許可したり、ドメインユーザーが TensorBoard 視覚化プラグインを使用してモデルデバッグタスクを実行できるようにしたりするオプションを提供します。SageMaker AI with TensorBoard は、SageMaker AI データマネージャープラグインによって拡張されています。このプラグインを使用すると、ドメインユーザーは TensorBoard アプリケーション内の 1 か所で多数のトレーニングジョブにアクセスできます。

注記

この機能は、PyTorch または TensorFlow を使用して深層学習モデルのトレーニングをデバッグするためのものです。

データサイエンティスト向け

大規模なモデルをトレーニングすると、モデルの収束性を改善して勾配降下プロセスを安定させるために、データサイエンティストがデバッグして解決しなければならない科学的な問題が発生する可能性があります。

損失が収束しない、重みや勾配が消失したり爆発的に増加したりするなど、モデルトレーニングの問題が発生した場合は、テンソルデータにアクセスしてモデルパラメータ、スカラー、カスタムメトリクスを詳細に分析する必要があります。SageMaker AI with TensorBoard を使用すると、トレーニングジョブから抽出されたモデル出力テンソルを視覚化できます。異なるモデル、複数のトレーニング実行、モデルのハイパーパラメータを試すときに、TensorBoard で複数のトレーニングジョブを選択し、1 か所で比較できます。

管理者向け

AWS アカウントまたは SageMaker AI ドメインの管理者であれば、SageMaker AI コンソールまたは SageMaker AI ドメインの TensorBoard ランディングページから TensorBoard アプリケーションユーザーを管理できます。各ドメインユーザーは、付与されたアクセス許可を使用して、独自の TensorBoard アプリケーションにアクセスできます。SageMaker AI ドメイン管理者およびドメインユーザーは、自分の持つアクセス許可レベルに応じて TensorBoard アプリケーションを作成および削除できます。

注記

SageMaker AI ドメインではユーザー間でのアプリケーション共有が許可されていないため、TensorBoard アプリケーションをコラボレーションの目的で共有することはできません。バケットへのアクセス権があれば、ユーザーは S3 バケットに保存された出力テンソルを共有できます。

サポートされるフレームワークと AWS リージョン

SageMaker AI の TensorBoard アプリケーションは、次の機械学習フレームワークと AWS リージョンで使用できます。

フレームワーク
  • PyTorch

  • TensorFlow

  • Hugging Face Transformer

AWS リージョン
  • 米国東部 (バージニア北部) (us-east-1)

  • 米国東部 (オハイオ) (us-east-2)

  • 米国西部 (オレゴン) (us-west-2)

  • 欧州 (フランクフルト) (eu-central-1)

  • 欧州 (アイルランド) (eu-west-1)

注記

Amazon SageMaker AI with TensorBoard は、ml.r5.large インスタンスで実行され、SageMaker AI の無料利用枠または機能の無料試用期間後に料金が発生します。詳細については、「Amazon SageMaker AI Pricing」を参照してください。