

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# モデルをエンドポイントにデプロイする
<a name="canvas-deploy-model"></a>

Amazon SageMaker Canvas では、モデルをエンドポイントにデプロイして予測を行うことができます。SageMaker AI は、選択したコンピューティングインスタンスを使用して、エンドポイントでモデルをホストするための ML インフラストラクチャを提供します。次に、エンドポイントを*呼び出し* (予測リクエストを送信)、モデルからリアルタイム予測を取得できます。この機能を使用すると、本番環境でモデルを使用して受信リクエストに応答し、モデルを既存のアプリケーションやワークフローと統合できます。

開始するには、デプロイするモデルが必要です。構築したカスタムモデルバージョン、Amazon SageMaker JumpStart 基盤モデル、ファインチューニングされた JumpStart 基盤モデルをデプロイできます。Canvas でのモデル構築の詳細については、「[カスタムモデルの仕組み](canvas-build-model.md)」を参照してください。Canvas での JumpStart 基盤モデルの詳細については、「[SageMaker Canvas の生成 AI 基盤モデル](canvas-fm-chat.md)」を参照してください。

次の「**権限の管理**」セクションを確認してから、「**モデルをデプロイする**」セクションで新しいデプロイの作成を開始します。

## 権限の管理
<a name="canvas-deploy-model-prereqs"></a>

デフォルトでは、SageMaker AI ホスティングエンドポイントにモデルをデプロイするアクセス許可がユーザーに付与されています。SageMaker AI は、Canvas アプリケーションをホストする SageMaker AI ドメインの AWS IAM 実行ロールにアタッチされている [AmazonSageMakerCanvasFullAccess](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerCanvasFullAccess.html) ポリシーを介して、すべての新規および既存の Canvas ユーザープロファイルにこれらのアクセス許可を付与します。

Canvas 管理者が新しいドメインまたはユーザープロファイルを設定する場合、ドメインを設定し、「[Amazon SageMaker Canvas を設定するための前提条件](canvas-getting-started.md#canvas-prerequisites)」の前提条件の指示に従うと、SageMaker AI は **[Canvas モデルの直接デプロイを有効にする]** オプションを使用してモデルデプロイのアクセス許可を有効にします。このオプションはデフォルトで有効になっています。

Canvas 管理者はモデルのデプロイ権限をユーザープロファイルレベルでも管理できます。例えば、管理者がドメインの設定時にすべてのユーザープロファイルにモデルのデプロイ権限を付与しない場合は、ドメインの作成後に特定のユーザーに権限を付与できます。

特定のユーザープロファイルのモデルのデプロイ権限を変更するには、次の手順に従います。

1. SageMaker AI コンソール ([https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/)) を開きます。

1. 左のナビゲーションペインで、**[管理設定‭]** を選択します。

1. **[管理設定]** で、**[ドメイン]** を選択します。

1. ドメインのリストで、ユーザープロファイルのドメインを選択します。

1. **[ドメインの詳細]** ページで、**[ユーザープロファイル]** タブを選択します。

1. **[ユーザープロファイル]** を選択します。

1. ユーザープロファイルページで、**[アプリケーション設定]** タブを選択します。

1. **[Canvas]** セクションで、**[編集]** を選択します。

1. **[ML Ops 設定]** セクションで、**[Canvas モデルの直接デプロイを有効にする]** トグルをオンにして、デプロイ権限を有効にします。

1. **[送信]** を選択して、ドメインの設定の変更を保存します。

これでユーザープロファイルにモデルのデプロイ権限が付与されます。

ドメインまたはユーザープロファイルに権限を付与したら、権限の変更を適用するために、ユーザーが Canvas アプリケーションからログアウトし、再度ログインすることを確認してください。

## モデルをデプロイする
<a name="canvas-deploy-model-deploy"></a>

モデルのデプロイを開始するには、Canvas で新しいデプロイを作成し、モデルのホストに使用するコンピューティングインスタンスのタイプや数など、ML インフラストラクチャとともにデプロイするモデルバージョンを指定します。

Canvas では、モデルタイプに基づいてインスタンスのデフォルトのタイプと数を提案します。[Amazon SageMaker の料金ページ](https://aws.amazon.com/sagemaker/pricing/)でさまざまな SageMaker インスタンスタイプの詳細を確認することもできます。エンドポイントがアクティブな間は、SageMaker AI インスタンスの料金に基づいて課金されます。

JumpStart 基盤モデルをデプロイする際には、デプロイ時間の長さを指定するオプションもあります。モデルはエンドポイントに無期限にデプロイできます (つまり、エンドポイントはデプロイを削除するまでアクティブになります)。あるいは、エンドポイントを短期間のみ必要とし、コストを削減したい場合は、指定された期間のみエンドポイントにモデルをデプロイできます。その後、SageMaker AI はエンドポイントをシャットダウンします。

**注記**  
指定の期間だけモデルをデプロイする場合は、エンドポイントの存続期間中、Canvas アプリケーションにログインしたままにします。アプリケーションからログアウトするか、アプリケーションを削除した場合、Canvas は指定された時間にエンドポイントをシャットダウンできなくなります。

モデルが SageMaker AI ホスティングの[リアルタイム推論エンドポイント](https://docs.aws.amazon.com/sagemaker/latest/dg/realtime-endpoints.html)にデプロイされたら、エンドポイントを*呼び出し*て、予測を開始できます。

Canvas アプリケーションからモデルをデプロイする方法はいくつかあります。モデルのデプロイオプションには、次のいずれかの方法を使用してアクセスできます。
+ Canvas アプリケーションの **[マイモデル]** ページで、デプロイするモデルを選択します。次に、モデルの **[バージョン]** ページから、モデルバージョンの横にある **[その他のオプション]** アイコン (![](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png)) を選択し、 **[デプロイ]** を選択します。
+ モデルバージョンの詳細ページにある **[分析]** タブで、**[デプロイ]** オプションを選択します。
+ モデルバージョンの詳細ページにある **[予測]** タブで、ページの上部にある **[その他のオプション]** アイコン (![](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png)) を選択し、 **[デプロイ]** を選択します。
+ Canvas アプリケーションの **[ML オペレーション]** ページで、**[デプロイ]** タブを選択し、**[デプロイの作成]** を選択します。
+ JumpStart 基盤モデルおよびファインチューニングされた基盤モデルの場合は、Canvas アプリケーションの **[Ready-to-use モデル]** ページに移動します。**[コンテンツの生成、抽出、要約]** を選択します。次に、デプロイする JumpStart 基盤モデルまたはファインチューニングされた基盤モデルを見つけます。モデルを選択し、モデルのチャットページで **[デプロイ]** ボタンを選択します。

これらのどの方法によっても、**[モデルをデプロイ]** サイドパネルが開かれます。ここではモデルのデプロイ設定を指定します。このパネルからモデルをデプロイするには、以下を実行します。

1. (オプション) **[ML オペレーション]** ページからデプロイを作成する場合は、**[モデルとバージョンを選択する]** オプションがあります。ドロップダウンメニューを使用して、デプロイするモデルとモデルのバージョンを選択します。

1. **[デプロイ名]** フィールドに名前を入力します。

1. (JumpStart 基盤モデルとファインチューニングされた基盤モデルのみ) **[デプロイの長さ]** を選択します。**[無制限]** を選択すると、エンドポイントはシャットダウンされるまでアクティブのままになります。または、**[長さを指定]** を選択してから、エンドポイントをアクティブのままにする期間を入力します。

1. **[インスタンスタイプ]** に対し、SageMaker AI はモデルに適したデフォルトのインスタンスタイプと番号を検出します。ただし、モデルのホストに使用するインスタンスタイプは変更できます。
**注記**  
 AWS アカウントで選択したインスタンスタイプのインスタンスクォータを使い切った場合は、クォータの引き上げをリクエストできます。デフォルトのクォータと、引き上げのリクエスト方法の詳細については、*AWS 全般のリファレンスガイド*の「[Amazon SageMaker エンドポイントとクォータ](https://docs.aws.amazon.com/general/latest/gr/sagemaker.html)」を参照してください。

1. **[インスタンス数]** では、エンドポイントに使用されるアクティブなインスタンスの数を設定できます。SageMaker AI は、モデルに適したデフォルトの数を検出しますが、この数は変更できます。

1. モデルをデプロイする準備ができたら、**[デプロイ]** を選択します。

これで、モデルがエンドポイントにデプロイされます。