ネットワークの隔離イメージのサイズストレージサイズインスタンスサイズ推論のペイロードサイズ推論の処理時間 Service Quotas 非同期推論サーバーレス推論マネージドスポットトレーニング Docker イメージと AWS アカウント組み込みアルゴリズムまたは AWS Marketplace からのモデルパッケージの公開公開でサポートされる AWS リージョン

AWS Marketplace での機械学習製品のサービスの制限とクォータ

このセクションでは、AWS Marketplace の機械学習 (ML) 製品の制限とクォータについて説明します。

トピック

ネットワークの隔離
イメージのサイズ
ストレージサイズ
インスタンスサイズ
推論のペイロードサイズ
推論の処理時間
Service Quotas
非同期推論
サーバーレス推論
マネージドスポットトレーニング
Docker イメージと AWS アカウント
組み込みアルゴリズムまたは AWS Marketplace からのモデルパッケージの公開
公開でサポートされる AWS リージョン

ネットワークの隔離

セキュリティ上の理由から、コンテナ化された製品を購入者がサブスクライブすると、Docker コンテナはネットワークアクセスのない隔離された環境で実行されます。コンテナの作成時には、インターネット経由での呼び出しに依存しないでください。その呼び出しは失敗します。AWS のサービスへの呼び出しも失敗します。

イメージのサイズ

Docker イメージのサイズは、Amazon Elastic Container Registry (Amazon ECR) のService Quotas によって管理されます。Docker イメージのサイズは、トレーニングジョブ、バッチ変換ジョブ、エンドポイント作成時の起動時間に影響します。パフォーマンスを向上させるため、最適な Docker イメージのサイズを維持してください。

ストレージサイズ

エンドポイントが作成されると、Amazon SageMaker AI は、エンドポイントをホストする各 ML コンピューティングインスタンスに Amazon Elastic Block Store (Amazon EBS) ストレージボリュームをアタッチします。(エンドポイントはリアルタイム推論または Amazon SageMaker AI ホスティングサービスとも呼ばれます)。ストレージボリュームのサイズは、インスタンスタイプによって異なります。詳細については、「Amazon SageMaker AI デベロッパーガイド」の「ホストインスタンスストレージボリューム」を参照してください。

バッチ変換については、「Amazon SageMaker AI デベロッパーガイド」の「バッチ変換のストレージ」を参照してください。

インスタンスサイズ

SageMaker AI では、インスタンスタイプの選択肢があり、ML のさまざまなユースケースに合わせて最適化できます。インスタンスタイプは、CPU、GPU、メモリ、およびネットワーク容量のさまざまな組み合わせで構成されます。インスタンスタイプでは、ML モデルの構築、トレーニング、デプロイに適したリソースの組み合わせを柔軟に選択できます。詳細については、「Amazon SageMaker AI ML インスタンスタイプ」を参照してください。

推論のペイロードサイズ

エンドポイントの場合、1 回の呼び出しあたりの入力データの最大サイズが 25 MB に制限されます。この値を調整することはできません。

バッチ変換の場合、1 回の呼び出しあたりの入力データの最大サイズは 100 MB です。この値を調整することはできません。

推論の処理時間

エンドポイントの場合、呼び出しあたりの最大処理時間は、通常のレスポンスの場合は 60 秒、ストリーミングレスポンスの場合は 8 分です。この値を調整することはできません。

バッチ変換の場合、1 回の呼び出しあたりの最大処理時間は 60 分です。この値を調整することはできません。

Service Quotas

トレーニングと推論に関連するクォータの詳細については、「Amazon SageMaker AI Service Quotas」を参照してください。

非同期推論

AWS Marketplace で公開されたモデルパッケージとアルゴリズムは、Amazon SageMaker AI 非同期推論用に設定されたエンドポイントにはデプロイできません。非同期推論用に設定されたエンドポイントの場合、モデルにネットワーク接続が必要です。すべての AWS Marketplace モデルはネットワークから切り離された状態で動作します。詳細については、「No network access」を参照してください。

サーバーレス推論

AWS Marketplace で公開されたモデルパッケージとアルゴリズムは、Amazon SageMaker AI Serverless Inference に設定されたエンドポイントにはデプロイできません。サーバーレス推論用に設定されたエンドポイントの場合、モデルにネットワーク接続が必要です。すべての AWS Marketplace モデルはネットワークから切り離された状態で動作します。詳細については、「No network access」を参照してください。

マネージドスポットトレーニング

AWS Marketplace からのすべてのアルゴリズムでは、マネージド型スポットトレーニングのチェックポイントが実装されている場合でも、MaxWaitTimeInSeconds の値は 3,600 秒 (60 分) に設定されます。この値を調整することはできません。

Docker イメージと AWS アカウント

公開するには、販売者の AWS アカウントが所有する Amazon ECR リポジトリにイメージを保存する必要があります。ほかの AWS アカウントが所有するリポジトリに保存されているイメージを公開することはできません。

組み込みアルゴリズムまたは AWS Marketplace からのモデルパッケージの公開

Amazon SageMaker AI の組み込みアルゴリズムまたは AWS Marketplace サブスクリプションのアルゴリズムを使用してトレーニングジョブから作成されたモデルパッケージは、公開できません。

トレーニングジョブのモデルアーティファクトは引き続き使用できますが、モデルパッケージを公開するには独自の推論イメージが必要です。

公開でサポートされる AWS リージョン

AWS Marketplace は、以下のどちらにも当てはまる AWS リージョンからのモデルパッケージとアルゴリズムのリソースの公開をサポートします。

Amazon SageMaker AI がサポートするリージョン
デフォルトでオプトインされている利用可能なリージョン (例えば、describe-regions が返す "OptInStatus": "opt-in-not-required" など)

モデルパッケージまたはアルゴリズム製品の公開に必要なすべてのアセットは、公開元と同じリージョンに保存する必要があります。これには以下が含まれます。

Amazon SageMaker AI で作成されたモデルパッケージとアルゴリズムのリソース
Amazon ECR リポジトリにアップロードされる推論イメージとトレーニングイメージ
Amazon Simple Storage Service に保存され、モデルパッケージリソースのモデルデプロイ中に動的にロードされるモデルアーティファクト (存在する場合)
Amazon S3 に保存されている推論およびトレーニング検証用のテストデータ

SageMaker AI がサポートするどのリージョンでも、製品の開発とトレーニングを行うことができます。ただし、公開する前に、AWS Marketplace が発行元をサポートしているリージョンにすべてのアセットをコピーして、そのリージョンでリソースを再作成する必要があります。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

機械学習製品の料金

セキュリティと知的財産