推奨 Trainium インスタンス
AWS Trainium インスタンスは、深層学習モデル推論のワークロードに高いパフォーマンスとコスト効率を提供するように設計されています。具体的には、Trn1 インスタンスタイプは、AWS Trainium チップと AWS Neuron SDK
お客様は Trn1 インスタンスを使用して、検索、レコメンデーションエンジン、コンピュータビジョン、音声認識、自然言語処理、パーソナライゼーション、不正検出などの大規模な機械学習推論アプリケーションをクラウド内で低コストで実行できます。
注記
モデルのサイズは、インスタンスを選択する際の要因となります。モデルがインスタンスの使用可能な RAM を超えている場合は、アプリケーション用に十分なメモリを持つ別のインスタンスタイプを選択します。
Amazon EC2 Trn1 インスタンス
は、最大 16 個の AWS Trainium チップと 100 Gbps のネットワーキングスループットを備えています。