基盤モデルとカスタム微調整モデルをデプロイする - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

基盤モデルとカスタム微調整モデルをデプロイする

Amazon SageMaker JumpStart から事前トレーニング済みの基盤のオープンウェイトモデルまたはゲートモデルをデプロイするか、Amazon S3 または Amazon FSx に保存されている独自のカスタムモデルまたはファインチューニングモデルをデプロイするかにかかわらず、SageMaker HyperPod は、本番推論ワークロードに必要な柔軟でスケーラブルなインフラストラクチャを提供します。 FSx

JumpStart からオープンウェイトとゲート付き基盤モデルをデプロイする Amazon S3 と Amazon FSx からカスタムモデルとファインチューニングされたモデルをデプロイする
説明

各モデルファミリーに合わせた自動最適化およびスケーリングポリシーを使用して、事前トレーニング済みの基盤モデルの包括的なカタログからデプロイします。

独自のカスタムモデルと微調整されたモデルを導入し、SageMaker HyperPod のエンタープライズインフラストラクチャを活用して本番スケールの推論を行います。Amazon S3 を使用した費用対効果の高いストレージか、Amazon FSx を使用した高性能ファイルシステムのいずれかを選択します。
主な利点
  • Amazon SageMaker Studio UI によるワンクリックデプロイ

  • 受信リクエストに基づく自動スケーリングが自動的に有効

  • 各モデルファミリー用に事前に最適化されたコンテナと設定

  • ゲート付きモデルの EULA 処理

  • 複数のストレージバックエンドのサポート: Amazon S3、Amazon FSx

  • 柔軟なコンテナとフレームワークのサポート

  • モデルの特性に基づくカスタムスケーリングポリシー

デプロイオプション
  • ビジュアルデプロイ用の Amazon SageMaker Studio

  • Kubernetes ネイティブオペレーション用の kubectl

  • プログラムによる統合用の Python SDK

  • コマンドライン自動化用の HyperPod CLI

  • Kubernetes ネイティブオペレーション用の kubectl

  • プログラムによる統合用の Python SDK

  • コマンドライン自動化用の HyperPod CLI

以下のセクションでは、Amazon SageMaker JumpStart と Amazon S3 および Amazon FSx からモデルをデプロイする手順を示します。