翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
AWS Marketplace での機械学習製品のサービスの制限とクォータ
このセクションでは、AWS Marketplace の機械学習 (ML) 製品の制限とクォータについて説明します。
トピック
ネットワークの隔離
セキュリティ上の理由から、コンテナ化された製品を購入者がサブスクライブすると、Docker コンテナはネットワークアクセスのない隔離された環境で実行されます。コンテナの作成時には、インターネット経由での呼び出しに依存しないでください。その呼び出しは失敗します。AWS のサービス への呼び出しも失敗します。
イメージのサイズ
Docker イメージのサイズは、Amazon Elastic Container Registry (Amazon ECR) のService Quotas によって管理されます。Docker イメージのサイズは、トレーニングジョブ、バッチ変換ジョブ、エンドポイント作成時の起動時間に影響します。パフォーマンスを向上させるため、最適な Docker イメージのサイズを維持してください。
ストレージサイズ
エンドポイントが作成されると、Amazon SageMaker AI は、エンドポイントをホストする各 ML コンピューティングインスタンスに Amazon Elastic Block Store (Amazon EBS) ストレージボリュームをアタッチします。(エンドポイントはリアルタイム推論または Amazon SageMaker AI ホスティングサービスとも呼ばれます)。ストレージボリュームのサイズは、インスタンスタイプによって異なります。詳細については、「Amazon SageMaker AI デベロッパーガイド」の「ホストインスタンスストレージボリューム」を参照してください。
バッチ変換については、「Amazon SageMaker AI デベロッパーガイド」の「バッチ変換のストレージ」を参照してください。
インスタンスサイズ
SageMaker AI では、インスタンスタイプの選択肢があり、ML のさまざまなユースケースに合わせて最適化できます。インスタンスタイプは、CPU、GPU、メモリ、およびネットワーク容量のさまざまな組み合わせで構成されます。インスタンスタイプでは、ML モデルの構築、トレーニング、デプロイに適したリソースの組み合わせを柔軟に選択できます。詳細については、「Amazon SageMaker AI ML インスタンスタイプ
推論のペイロードサイズ
エンドポイントの場合、1 回の呼び出しあたりの入力データの最大サイズが 25 MB に制限されます。この値を調整することはできません。
バッチ変換の場合、1 回の呼び出しあたりの入力データの最大サイズは 100 MB です。この値を調整することはできません。
推論の処理時間
エンドポイントの場合、呼び出しあたりの最大処理時間は、通常のレスポンスの場合は 60 秒、ストリーミングレスポンスの場合は 8 分です。この値を調整することはできません。
バッチ変換の場合、1 回の呼び出しあたりの最大処理時間は 60 分です。この値を調整することはできません。
Service Quotas
トレーニングと推論に関連するクォータの詳細については、「Amazon SageMaker AI Service Quotas」を参照してください。
非同期推論
AWS Marketplace で公開されたモデルパッケージとアルゴリズムは、Amazon SageMaker AI 非同期推論用に設定されたエンドポイントにはデプロイできません。非同期推論用に設定されたエンドポイントの場合、モデルにネットワーク接続が必要です。すべての AWS Marketplace モデルはネットワークから切り離された状態で動作します。詳細については、「No network access」を参照してください。
サーバーレス推論
AWS Marketplace で公開されたモデルパッケージとアルゴリズムは、Amazon SageMaker AI Serverless Inference に設定されたエンドポイントにはデプロイできません。サーバーレス推論用に設定されたエンドポイントの場合、モデルにネットワーク接続が必要です。すべての AWS Marketplace モデルはネットワークから切り離された状態で動作します。詳細については、「No network access」を参照してください。
マネージドスポットトレーニング
AWS Marketplace からのすべてのアルゴリズムでは、マネージド型スポットトレーニングのチェックポイントが実装されている場合でも、MaxWaitTimeInSeconds の値は 3,600 秒 (60 分) に設定されます。この値を調整することはできません。
Docker イメージと AWS アカウント
公開するには、販売者の AWS アカウント が所有する Amazon ECR リポジトリにイメージを保存する必要があります。ほかの AWS アカウント が所有するリポジトリに保存されているイメージを公開することはできません。
組み込みアルゴリズムまたは AWS Marketplace からのモデルパッケージの公開
Amazon SageMaker AI の組み込みアルゴリズムまたは AWS Marketplace サブスクリプションのアルゴリズムを使用してトレーニングジョブから作成されたモデルパッケージは、公開できません。
トレーニングジョブのモデルアーティファクトは引き続き使用できますが、モデルパッケージを公開するには独自の推論イメージが必要です。
公開でサポートされる AWS リージョン
AWS Marketplace は、以下のどちらにも当てはまる AWS リージョン からのモデルパッケージとアルゴリズムのリソースの公開をサポートします。
-
Amazon SageMaker AI がサポート
するリージョン -
デフォルトでオプトインされている利用可能なリージョン
(例えば、describe-regions が返す "OptInStatus": "opt-in-not-required"など)
モデルパッケージまたはアルゴリズム製品の公開に必要なすべてのアセットは、公開元と同じリージョンに保存する必要があります。これには以下が含まれます。
-
Amazon SageMaker AI で作成されたモデルパッケージとアルゴリズムのリソース
-
Amazon ECR リポジトリにアップロードされる推論イメージとトレーニングイメージ
-
Amazon Simple Storage Service に保存され、モデルパッケージリソースのモデルデプロイ中に動的にロードされるモデルアーティファクト (存在する場合)
-
Amazon S3 に保存されている推論およびトレーニング検証用のテストデータ
SageMaker AI がサポートするどのリージョンでも、製品の開発とトレーニングを行うことができます。ただし、公開する前に、AWS Marketplace が発行元をサポートしているリージョンにすべてのアセットをコピーして、そのリージョンでリソースを再作成する必要があります。