翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
GPU アクセラレーターを使用する
1 つ以上の GPUs を使用してジョブの処理を高速化するように、サービスマネージドフリートでワーカーホストを設定できます。アクセラレーターを使用すると、ジョブの処理にかかる時間を短縮できますが、各ワーカーインスタンスのコストが増加する可能性があります。GPU アクセラレーターとそうでないフリートとのトレードオフを理解するには、ワークロードをテストする必要があります。
GPUsは、wait-and-saveのインスタンスを持つフリートでは使用できません。
注記
テスト目的では、1 つの GPU に制限されます。本稼働ワークロードの詳細をリクエストするには、「Service Quotas ユーザーガイド」の「クォータの引き上げのリクエスト」を参照してください。 Service Quotas
ワーカーインスタンス機能を指定するときに、フリートが GPU アクセラレーターを使用するかどうかを決定します。GPUs を使用する場合は、各インスタンスの GPUs の最小数と最大数、使用する GPU チップのタイプ、GPUs のランタイムドライバーを指定できます。
使用可能な GPU アクセラレーターは次のとおりです。
-
T4- NVIDIA T4 Tensor コア GPU -
A10G- NVIDIA A10G Tensor コア GPU -
L4- NVIDIA L4 Tensor Core GPU -
L40s- NVIDIA L40S Tensor Core GPU
次のランタイムドライバーから選択できます。
-
Latest- チップで使用できる最新のランタイムを使用します。を指定latestし、ランタイムの新しいバージョンがリリースされると、ランタイムの新しいバージョンが使用されます。 -
grid:r570- NVIDIA vGPU ソフトウェア 18 -
grid:r535- NVIDIA vGPU ソフトウェア 16
ランタイムを指定しない場合、Deadline Cloud はデフォルトlatestとして を使用します。ただし、複数のアクセラレーターがあり、一部のアクセラレーターlatestに を指定し、他のアクセラレーターを空白のままにすると、Deadline Cloud は例外を発生させます。