高度なワークフロー機能 - Amazon Quick Suite

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

高度なワークフロー機能

Amazon Quick Sight のデータ準備エクスペリエンスは、複雑で再利用可能なデータ変換を作成する機能を強化する高度な機能を提供します。このセクションでは、ワークフローの可能性を広げる 2 つの強力な機能について説明します。

分散を使用すると、1 つのステップから複数の変換パスを作成し、後で再結合できる並列処理ストリームを作成できます。この機能は、自己結合や並列変換などの複雑なシナリオに特に役立ちます。

Composite Datasets では、既存のデータセットを構成要素として使用して階層データ構造を構築できます。この機能は、チーム間のコラボレーションを促進し、再利用可能なレイヤード変換を通じて一貫したビジネスロジックを確保します。

これらの機能は連携して、柔軟なワークフロー設計、チームコラボレーションの強化、再利用可能なデータ変換を提供します。これにより、データリネージが明確になり、スケーラブルなデータ準備ソリューションが可能になり、組織がますます複雑になるデータシナリオを効率的かつ明確に処理できるようになります。

分散

分散を使用すると、ワークフローの 1 つのステップから複数の並列変換パスを作成できます。これらのパスは個別に変換でき、後で再結合できるため、自己結合などの複雑なデータ準備シナリオが可能になります。

異なるパスの作成

分散を開始するには、ワークフローで次の操作を行います。

  1. 発散を作成するステップを選択します。

  2. 表示される + アイコンを選択します。

  3. 表示される新しいブランチを設定します。

  4. 必要な変換を各パスに適用します。

  5. 結合または追加ステップを使用して、パスを 1 つの出力に再結合します。

主な特徴

  • 1 つのステップから最大 5 つの異なるパスを作成します。

  • 各パスに異なる変換を適用します。

  • 結合または追加ステップを使用してパスを再結合します。

  • 各パスの変更を個別にプレビューします。

ベストプラクティス

  • 自己結合の実装には相違を使用します。

  • 並列変換用のデータコピーを作成します。

  • 再結合戦略 (参加または追加) を計画します。

  • ワークフローの可視性を向上させるために、明確なパスの命名を維持します。

複合データセット

Composite Datasets を使用すると、既存のデータセットに基づいて構築し、組織全体で共有および再利用できる階層データ変換構造を作成できます。Quick Sight は、SPICE モードと Direct Query モードの両方で最大 10 レベルの複合データセットをサポートします。

複合データセットの作成

複合データセットを作成するには、ワークフローで次の操作を行います。

  1. 新しいデータセットを作成するときに入力ステップを選択します。

  2. データの追加で、ソースとしてデータセットを選択します。

  3. 構築する既存のデータセットを選択します。

  4. 必要に応じて追加の変換を適用します。

  5. 新しいデータセットとして保存します。

主な特徴

  • 階層データ変換構造を構築します。

  • 最大 10 レベルのデータセットネストをサポートします。

  • SPICE と Direct Query の両方と互換性があります。

  • 明確なデータリネージを維持します。

  • チーム固有の変換を有効にします。

この機能は、さまざまなチーム間のコラボレーションを強化します。例えば、

ロール アクション Output

グローバルアナリスト

グローバルビジネスロジックを使用してデータセットを作成します

データセット A

南北アメリカアナリスト

データセット A を使用し、リージョンロジックを追加します

データセット B

米国西部アナリスト

データセット B を使用し、ローカルロジックを追加します

データセット C

この階層的アプローチは、変換レイヤーの明確な所有権を割り当てることで、組織全体で一貫したビジネスロジックを促進します。最大 10 レベルのデータセットネストをサポートしながら、追跡可能なデータ系統を作成し、制御された体系的なデータ変換管理を可能にします。

ベストプラクティス

  • 各変換レイヤーに明確な所有権を確立します。

  • データセットの関係と依存関係を文書化します。

  • ビジネスニーズに基づいて階層の深さを計画します。

  • 一貫した命名規則を維持します。

  • アップストリームデータセットを慎重に確認および更新します。