Amazon SageMaker AI モデルと Amazon Quick Sight の統合 - Amazon Quick Suite

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon SageMaker AI モデルと Amazon Quick Sight の統合

注記

Amazon Quick Sight で ML を活用した機能を使用する分析やダッシュボードを作成するために、機械学習 (ML) の技術的な経験は必要ありません。

Amazon Quick Suite Enterprise Edition のデータは、Amazon SageMaker AI 機械学習モデルで拡張できます。Quick Suite でサポートされている任意のデータソースからSPICEインポートされた に保存されているデータに対して推論を実行できます。サポートされているデータソースの詳細な一覧については、サポートされているデータソースを参照してください。

SageMaker AI モデルで Quick Suite を使用すると、データ移動の管理やコードの記述に費やす時間を節約できます。この結果は、モデルの評価や、(結果に満足している場合は) 意思決定者との共有に有用です。モデルが作成された直後に開始できます。これにより、データサイエンティストが事前に構築したモデルが表れ、データサイエンスをデータセットに適用できるようになります。その後、予測ダッシュボードでこれらのインサイトを共有できます。Quick Suite サーバーレスアプローチを使用すると、プロセスはシームレスにスケールされるため、推論やクエリ容量について心配する必要はありません。

Amazon Quick Suite は、回帰アルゴリズムと分類アルゴリズムを使用する SageMaker AI モデルをサポートしています。この機能を適用すると、ほぼすべてのビジネスユースケースに関する予測を立てることができます。例えば、顧客の解約、従業員の離職、セールスリードの採点、信用リスクの評価などに予測を利用できます。Quick Suite を使用して予測を提供するには、入力と出力の両方の SageMaker AI モデルデータが表形式である必要があります。マルチクラス分類またはマルチラベル分類のユースケースでは、各出力列に単一の値を含める必要があります。Quick Suite は、1 つの列内の複数の値をサポートしていません。

SageMaker AI 統合の仕組み

一般に、プロセスは次のように動作します。

  1. Amazon Quick Suite 管理者は、Quick Suite が SageMaker AI にアクセスするためのアクセス許可を追加します。これを行うには、クイックスイートの管理ページからセキュリティとアクセス許可の設定を開きます。 AWS サービスへのクイックスイートアクセスに移動し、SageMaker AI を追加します。

    これらのアクセス許可を追加すると AWS Identity and Access Management 、Quick Suite が (IAM) ロールに追加され、アカウント AWS 内のすべての SageMaker AI モデルを一覧表示するためのアクセスが提供されます。名前の先頭に quicksight-auto-generated- のプレフィックスが付いた SageMaker AI ジョブを実行するアクセス許可も付与されます。

  2. データの前処理が自動的に実行されるため、推論パイプラインを持つ SageMaker AI モデルに接続することをお勧めします。詳細については、「SageMaker AI Developer Guide」の「Deploy an Inference Pipeline」を参照してください。

  3. 一緒に使用するデータと事前トレーニング済みモデルを特定したら、モデルの所有者がスキーマファイルを作成し、提供します。この JSON ファイルが、SageMaker AI との契約の役割を果たします。モデルが想定するフィールド、データタイプ、列の順序、出力、設定に関するメタデータを提供します。オプションの設定コンポーネントは、ジョブに使用するコンピュートインスタンスのインスタンスサイズと数を提供します。

    モデルを構築したデータサイエンティストは、次に説明する’形式でこのスキーマファイルを作成します。モデルのコンシューマは、モデルの所有者からスキーマファイルを取得します。

  4. Quick Suite では、まず、予測を行うデータを含む新しいデータセットを作成します。ファイルをアップロードする場合は、アップロード設定画面で SageMaker AI モデルを追加します。それ以外の場合は、データ準備ページでモデルを追加します。

    先に進む前に、データセットとモデルの間のマッピングを確認します。

  5. データがデータセットにインポートされると、出力フィールドには SageMaker AI から返されたデータが含まれます。これらのフィールドは、「使用上のガイドライン」で説明されているガイドライン内で、他のフィールドと同じように使用できます。

    SageMaker AI 統合を実行すると、Quick Suite は SageMaker AI にリクエストを渡し、推論パイプラインを使用してバッチ変換ジョブを実行します。Quick Suite は AWS 、アカウントに必要なインスタンスのプロビジョニングとデプロイを開始します。処理が完了すると、これらのインスタンスはシャットダウンされ、終了します。コンピューティング性能は、モデルの処理時にのみコストが発生します。

    識別しやすくするために、Quick Suite はすべての SageMaker AI ジョブにプレフィックス を付けますquicksight-auto-generated-

  6. 推論の出力は SPICE に保存され、データセットに追加されます。推論が完了するとすぐに、データセットを使用して、予測データを使用して視覚化やダッシュボードを作成できます。

  7. データ更新は、データセットを保存するたびに開始されます。SPICE データセットを更新してデータ更新プロセスを手動で開始する、または定期的に更新プロセスが実行されるようにスケジュールすることができます。データ更新のたびに、システムは SageMaker AI のバッチ変換を自動的に呼び出し、出力フィールドを新しいデータで更新します。

    Amazon Quick Sight SPICE 取り込み API オペレーションを使用して、データ更新プロセスを制御できます。これらの API オペレーションの使用の詳細については、「Amazon Quick Sight API リファレンス」を参照してください。

発生したコスト(統合自体による追加コストはありません)

この機能を使用すること自体に追加料金はかかりません。費用には以下が含まれます。

  • SageMaker AI によるモデルデプロイのコストは、モデルが実行されている場合にのみ発生します。データセットの作成もしくは編集後、またはデータの更新後にデータセットを保存すると、データの取り込みが開始されます。データセットに推論されたフィールドがある場合、このプロセスには SageMaker AI の呼び出しが含まれます。コストは、Quick Suite サブスクリプションと同じ AWS アカウントで発生します。

  • Quick Suite のサブスクリプションコストは次のとおりです。

    • Quick Suite () のメモリ内計算エンジンにデータを保存するコストSPICE。SPICE に新しいデータを追加するときは、それに対応するために十分な SPICE 容量を購入する必要が生じる場合があります。

    • データセットを構築する作成者または管理者の Quick Suite サブスクリプション。

    • 表示者(閲覧者)がインタラクティブなダッシュボードにアクセスするためのセッションごとの料金。

使用上のガイドライン

Amazon Quick Suite では、この Enterprise Edition 機能に次の使用ガイドラインが適用されます。

  • モデルの処理は SPICE で行われます。そのため、これは SPICE に保存されているデータセットにのみ適用できます。現在このプロセスでは、データセットあたり最大 5 億行がサポートされています。

  • Quick Suite の管理者または作成者のみが、ML モデルでデータセットを補強できます。閲覧者は、ダッシュボードの一部である場合にのみ結果を表示できます。

  • 各データセットは、1 つの ML モデルのみを処理できます。

  • 出力フィールドを使用して新しいフィールドを計算することはできません。

  • データセットは、モデルと統合されているフィールドでフィルタリングすることはできません。つまり、データセットフィールドが現在、機械学習モデルにマッピングされている場合、そのフィールドでフィルタリングすることはできません。

SageMaker AI では、Amazon Quick Sight で使用する事前トレーニング済みモデルに次の使用ガイドラインが適用されます。

  • モデルを作成するときに、適切な IAM ロールの Amazon リソースネーム (ARN) に関連付けます。SageMaker AI モデルの IAM ロールは、Amazon Quick Sight が使用する Amazon S3 バケットにアクセスできる必要があります。

  • モデルが入力と出力の両方で .csv ファイルをサポートしていることを確認します。データが表形式であることを確認します。

  • 入力フィールドと出力フィールドのリストを含む、モデルに関するメタデータを含むスキーマファイルを指定します。現在、このスキーマファイルは手動で作成する必要があります。

  • 推論を完了するのにかかる時間を考慮してください。これはいくつかの要因に依存します。これには、モデルの複雑さ、データ量、定義されたコンピューティング性能が含まれます。推論の完了には数分から数時間かかることがあります。Amazon Quick Sight は、すべてのデータ取り込みジョブと推論ジョブを最大 10 時間に制限します。推論の実行にかかる時間を短縮するには、インスタンスのサイズまたはインスタンスの数を増やすことを検討してください。

  • 現時点では、SageMaker AI との統合には、リアルタイムデータではなくバッチ変換のみを使用できます。SageMaker AI エンドポイントを使用することはできません。

スキーマファイルの定義

Quick Sight データで SageMaker AI モデルを使用する前に、Amazon Quick Sight がモデルを処理するために必要なメタデータを含む JSON スキーマファイルを作成します。Amazon Quick Suite の作成者または管理者は、データセットを設定するときにスキーマファイルをアップロードします。

スキーマフィールドは次のように定義されます。次の説明で指定されていない限り、すべてのフィールドは必須です。属性では、大文字と小文字が区別されます。

inputContentType

この SageMaker AI モデルが入力データに対して要求するコンテンツタイプ これに対してサポートされている値は "text/csv" のみです。Quick Sight には、入力ファイルに追加するヘッダー名は含まれません。

outputContentType

使用する SageMaker AI モデルによって生成される出力のコンテンツタイプ これに対してサポートされている値は "text/csv" のみです。

input

モデルが入力データで期待する機能のリスト。Quick Sight は、入力データをまったく同じ順序で生成します。このリストには次の属性が含まれています。

  • 名前 – 列の名前 可能な場合は、QuickSight データセットの対応する列の名前と同じ名前にします。この属性は最大 100 文字に制限されています。

  • – この列のデータ型 この属性は、"INTEGER""STRING"、および "DECIMAL" の値をとります。

  • nullable – (オプション) フィールドの NULL 値。デフォルト値は true です。nullable を に設定するとfalse、Quick Sight は SageMaker AI を呼び出す前に、この値を含まない行を削除します。これにより、必要なデータの欠落により SageMaker AI の処理が失敗するのを防ぎます。

output

SageMaker AI モデルによって生成される出力列のリスト Quick Sight は、これらのフィールドをまったく同じ順序で想定します。このリストには次の属性が含まれています。

  • name – この名前は、Quick Sight で作成された対応する新しい列のデフォルト名になります。Quick Sight でここで指定した名前を上書きできます。この属性は最大 100 文字に制限されています。

  • – この列のデータ型 この属性は、"INTEGER""STRING"、および "DECIMAL" の値をとります。

instanceTypes

変換ジョブを実行するために SageMaker AI がプロビジョニングできる ML インスタンスタイプのリスト リストは、Amazon Quick Suite ユーザーに提供されます。このリストは、SageMaker AI でサポートされているタイプに限定されます。サポートされるタイプの詳細については、「SageMaker AI Developer Guide」の「TransformResources」を参照してください。

defaultInstanceType

(オプション) Quick Sight の SageMaker AI ウィザードでデフォルトオプションとして表示されるインスタンスタイプ。このインスタンスタイプを instanceTypes に含めます。

instanceCount

(オプション) インスタンス数は、選択済みインスタンスのうち変換ジョブの実行のために SageMaker AI がプロビジョニングするインスタンスの数を定義します。値は正の整数である必要があります。

説明

このフィールドは、SageMaker AI モデルを所有するユーザーが、Quick Sight でこのモデルを使用しているユーザーと通信するための場所を提供します。このフィールドを使用して、このモデルを正常に使用するためのヒントを提供します。たとえばこのフィールドには、データセットのサイズに基づいて、instanceTypes のリストから選択する有効なインスタンスタイプの選択に関する情報を含めることができます。このフィールドは最大 1,000 文字に制限されています。

version

スキーマのバージョン("1.0" など)。

次の例は、スキーマファイル内の JSON の構造を示しています。

{ "inputContentType": "CSV", "outputContentType": "CSV", "input": [ { "name": "buying", "type": "STRING" }, { "name": "maint", "type": "STRING" }, { "name": "doors", "type": "INTEGER" }, { "name": "persons", "type": "INTEGER" }, { "name": "lug_boot", "type": "STRING" }, { "name": "safety", "type": "STRING" } ], "output": [ { "name": "Acceptability", "type": "STRING" } ], "description": "Use ml.m4.xlarge instance for small datasets, and ml.m4.4xlarge for datasets over 10 GB", "version": "1.0", "instanceCount": 1, "instanceTypes": [ "ml.m4.xlarge", "ml.m4.4xlarge" ], "defaultInstanceType": "ml.m4.xlarge" }

スキーマファイルの構造は、SageMaker AI が提供する例で使用されるモデルの種類に関連しています。

Quick Sight データセットへの SageMaker AI モデルの追加

次の手順を使用して、事前にトレーニングされた SageMaker AI モデルをデータセットに追加し、分析およびダッシュボードで予測データを使用できるようにします。

開始する前に、次の項目を使用可能にしておきます。

  • データセットの構築に使用するデータ。

  • データセットの拡張に使用する SageMaker AI モデルの名前

  • モデルのスキーマ。このスキーマには、フィールド名のマッピングとデータ型が含まれます。インスタンスタイプと使用するインスタンス数の推奨設定も含まれている場合に便利です。

SageMaker AI で Amazon Quick Sight データセットを補強するには
  1. スタートページから [Datasets] (データセット) を選択し、続いて [New data set] (新しいデータセット) を選択します。

    既存のデータセットを編集することもできます。

  2. データ準備画面で [Augment with SageMaker] (SageMaker による拡張) を選択します。

  3. [Select your model (モデルを選択)] で、次の設定を選択します。

    • [モデル] – フィールドの推論に使用する SageMaker AI モデルを選択します。

    • 名前 – モデルにわかりやすい名前を付けます。

    • スキーマ – モデル用に提供された JSON スキーマファイルをアップロードします。

    • アドバンスト設定 – QuickSight では、データセットに基づいて選択したデフォルトが推奨されます。特定のランタイム設定を使用して、ジョブの速度とコストのバランスをとることができます。これを行うには、[インスタンスタイプ] に SageMaker AI 機械学習インスタンスタイプを入力し、[カウント] にインスタンス数を入力します。

    [次へ] を選択して続行します。

  4. [Review inputs (レビュー入力)] で、データセットにマッピングされているフィールドを確認します。Quick Sight は、スキーマのフィールドをデータセットのフィールドに自動マッピングしようとします。マッピングを調整する必要がある場合は、ここで変更できます。

    [次へ] を選択して続行します。

  5. [Review outputs] (レビュー出力) で、データセットに追加されたフィールドを表示します。

    [Save and prepare data (保存してデータを準備する)] を選択して、選択内容を確認します。

  6. データを更新するには、詳細を表示するデータセットを選択します。次に、[Refresh Now (今すぐ更新)] を選択してデータを手動で更新するか [Schedule refresh (更新をスケジュール)] を選択して定期的な更新間隔を設定します。データ更新のたびに、システムは SageMaker AI のバッチ変換ジョブを自動的に実行し、出力フィールドを新しいデータで更新します。